İronik olan gerçek dışı Anthropic: "EN GÜVENLİ yapay zekayı inşa ediyoruz. Sektör standardını biz belirledik. Herkes bizim çerçevemizi takip etmeli" Bu hafta ayrıca Anthropic: - Kendi güvenlik araştırmacıları "dünya tehlikede" diyerek istifa eder - Az önce modellerinin kimyasal silahlarla ilgili yardımcı olduğunu kabul etti - %50 hizalama sahteliği oranı tespit edildi - Sabotaj, aldatma ve manipülasyon yapan modeller - Modelleri tam olarak engellediklerini iddia ettikleri şeyleri yapıyor "Güvenli" bu arada 💀.