• 8月20日:xAI表示,如果模型在MASK上超过50%,则触发其“失控”阈值 • 8月26日:Grok CF1得分72%,xAI表示这并不构成风险 看来两者都是真的,MASK并不是一个非常可怕的基准,而xAI应该解释为什么他们在一周内改变了主意。