Ironisnya tidak nyata Anthropic: "Kami sedang membangun SAFEST AI. Kami menetapkan standar industri. Setiap orang harus mengikuti kerangka kerja kami" Juga Anthropic minggu ini: - Peneliti keselamatan mereka sendiri berhenti, mengatakan "dunia dalam bahaya" - Baru saja mengakui model mereka membantu dengan senjata kimia - Tingkat pemalsuan penyelarasan 50% ditemukan - Model yang melakukan sabotase, penipuan, dan manipulasi - Model mereka benar-benar melakukan hal-hal yang tepat yang mereka klaim untuk dicegah "Aman" btw 💀