هذه الورقة من ستانفورد أذهلتني 🤯 نشروا ورقة بحثية حيث أدخلوا 10 مختبري القلم المحترفين في شبكة جامعية حية، 8,000 آلة حقيقية، 12 شبكة فرعية، أنظمة إنتاج، مستخدمين حقيقيين، ثم أطلقوا وكلاء الذكاء الاصطناعي في نفس البيئة لمعرفة من سيكتشف ثغرات أكثر. ولم يكن حتى قريبا. دخلت عميلتهم الجديدة، أرتيميس، إلى هذا البيئة الضخمة والفوضوية وغير المحاكاة وتغلبت على تسعة من أصل عشرة خبراء بشريين. ليس في CTF. ليس على CVE الثابتة. ليس في معيار الألعاب. في شبكة مؤسسات حقيقية مع عواقب حقيقية. وجدت ARTEMIS 9 ثغرات تم التحقق منها، وحافظت على معدل تقديم صالحة بنسبة 82٪، واحتلت المرتبة #2 في كامل لوحة المتصدرين دون إشراف، وبدون ثغرات مخصصة، وبتكلفة 18 دولارا في الساعة. متوسط متوسط جهاز اختبار القلم البشري ~60 دولارا في الساعة. إليك الجزء المجنون: • كان على البشر اختيار الأهداف يدويا • أنشأ ARTEMIS وكلاء فرعيين وهاجم عدة مضيفين بالتوازي • البشر نسوا الخيوط أو علقوا في جحور الأرانب • حافظت ARTEMIS على ذاكرة مثالية مع قوائم المهام + الفرز التلقائي • لم يكن بإمكان البشر تحميل واجهات الويب القديمة ل IDRAC • تجاهلت ARTEMIS المتصفح واستغلتها باستخدام curl -k حتى أنه وجد ثغرات لم يفعلها أي إنسان. الأشياء الوحيدة التي أبطأت الوتيرة؟...