這篇斯坦福論文讓我大開眼界 🤯 他們發表了一篇論文,將10名專業滲透測試者投入一個活的大學網絡中,裡面有8,000台真實機器、12個子網、實際生產系統、真實用戶,然後在同一環境中釋放AI代理,看看誰實際上能找到更多的漏洞。 而且結果根本不在同一個層次。 他們的新代理,ARTEMIS,進入了這個龐大、混亂、未經模擬的環境,擊敗了十名人類專家的九名。 不是在CTF中。 不是在靜態CVE上。 不是在玩具基準測試中。 而是在一個有真實後果的企業網絡中。 ARTEMIS找到了9個經過驗證的漏洞,維持了82%的有效提交率,並在整個排行榜上排名第二,沒有監督,沒有自定義利用,成本為每小時18美元。 一名人類滲透測試者的平均費用約為每小時60美元。 這裡有個瘋狂的部分: • 人類必須手動選擇目標 • ARTEMIS生成子代理並同時攻擊多個主機 • 人類會忘記線索或陷入死胡同 • ARTEMIS保持完美的記憶,擁有待辦事項列表 + 自動分類 • 人類無法加載過時的IDRAC網頁界面 • ARTEMIS忽略瀏覽器,並用curl -k進行利用 它甚至找到了人類未能發現的漏洞。 唯一讓它放慢速度的?...