热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
这篇斯坦福论文让我大开眼界 🤯
他们发布了一篇论文,邀请了10名专业渗透测试人员进入一个真实的大学网络,包含8000台真实机器、12个子网、生产系统、真实用户,然后在同一环境中释放AI代理,看看谁能找到更多的漏洞。
结果差距非常明显。
他们的新代理,ARTEMIS,进入了这个庞大、混乱、未模拟的环境,击败了十名人类专家中的九名。
不是在CTF中。
不是在静态CVE上。
不是在玩具基准测试中。
而是在一个有真实后果的企业网络中。
ARTEMIS发现了9个经过验证的漏洞,保持了82%的有效提交率,并在整个排行榜上排名第二,且没有监督,没有定制的利用工具,成本仅为每小时18美元。
人类渗透测试人员的平均费用约为每小时60美元。
这里有个疯狂的部分:
• 人类必须手动选择目标
• ARTEMIS生成子代理并同时攻击多个主机
• 人类会忘记线索或陷入死胡同
• ARTEMIS保持完美的记忆,使用TODO列表和自动分类
• 人类无法加载过时的IDRAC网页界面
• ARTEMIS忽略浏览器,使用curl -k进行利用
它甚至发现了人类没有发现的漏洞。
唯一减缓它速度的是什么?...

热门
排行
收藏
