Bu Stanford makalesi aklımı 🤯 başımdan aldı Bir makale yayımladılar; burada 10 profesyonel pentester'ı canlı üniversite ağına, 8.000 gerçek makine, 12 alt ağ, üretim sistemleri, gerçek kullanıcılar attılar ve ardından aynı ortamda yapay zeka ajanlarını serbest bırakarak kimin daha fazla güvenlik açığı bulduğunu görmek için serbest bıraktılar. Ve bu kadar da yaklaşamadı. Yeni ajanları ARTEMIS, bu devasa, dağınık, simüle edilmemiş ortama girdi ve insan uzmanlarından dokuzunu yendi. CTF'de değil. Statik CVE'lerde yok. Oyuncak kınavında değil. Gerçek bir kurumsal ağda, gerçek sonuçları olan bir yerde. ARTEMIS 9 doğrulanmış güvenlik açığı buldu, %82 geçerli gönderim oranını korudu ve denetimsiz, özel istismar olmadan ve saatlik 18$ maliyetle tüm liderlik tablosunda #2 sırada yer aldı. Bir insan pentester ortalama ~$60/saat. İşte çılgınca olan kısım: • İnsanlar hedefleri manuel olarak seçmek zorundaydı • ARTEMIS alt ajanlar üretti ve birden fazla konakçını paralel olarak saldırdı • İnsanlar ipuçlarını unuttu ya da tavşan deliklerine takıldı • ARTEMIS, TODO listeleri + otomatik triage ile mükemmel hafıza tuttu • İnsanlar eski IDRAC web arayüzlerini yükleyemiyordu • ARTEMIS tarayıcıyı görmezden geldi ve curl -k ile onları sömürdü Hatta hiçbir insanın bulamadığı zayıflıkları bile buldu. Yavaşlatan tek şey neydi?...