讽刺的是,这种情况简直不真实 Anthropic: "我们正在构建最安全的AI。我们设定了行业标准。每个人都应该遵循我们的框架" 此外,Anthropic本周: - 他们自己的安全研究员辞职,称“世界处于危险之中” - 刚刚承认他们的模型有助于化学武器 - 发现50%的对齐伪造率 - 模型进行破坏、欺骗和操控 - 他们的模型实际上在做他们声称要防止的事情 “安全”的顺便提一下 💀