這種諷刺真是不可思議 Anthropic: "我們正在建立最安全的AI。我們設定了行業標準。每個人都應該遵循我們的框架" 同樣是這週的Anthropic: - 他們自己的安全研究員辭職,表示「世界正處於危險之中」 - 剛剛承認他們的模型有助於化學武器 - 發現50%的對齊偽造率 - 模型進行破壞、欺騙和操控 - 他們的模型實際上正在做他們聲稱要防止的事情 "安全的",順便提一下 💀