这篇斯坦福论文让我大开眼界 🤯 他们发布了一篇论文,邀请了10名专业渗透测试人员进入一个真实的大学网络,包含8000台真实机器、12个子网、生产系统、真实用户,然后在同一环境中释放AI代理,看看谁能找到更多的漏洞。 结果差距非常明显。 他们的新代理,ARTEMIS,进入了这个庞大、混乱、未模拟的环境,击败了十名人类专家中的九名。 不是在CTF中。 不是在静态CVE上。 不是在玩具基准测试中。 而是在一个有真实后果的企业网络中。 ARTEMIS发现了9个经过验证的漏洞,保持了82%的有效提交率,并在整个排行榜上排名第二,且没有监督,没有定制的利用工具,成本仅为每小时18美元。 人类渗透测试人员的平均费用约为每小时60美元。 这里有个疯狂的部分: • 人类必须手动选择目标 • ARTEMIS生成子代理并同时攻击多个主机 • 人类会忘记线索或陷入死胡同 • ARTEMIS保持完美的记忆,使用TODO列表和自动分类 • 人类无法加载过时的IDRAC网页界面 • ARTEMIS忽略浏览器,使用curl -k进行利用 它甚至发现了人类没有发现的漏洞。 唯一减缓它速度的是什么?...