• 8月20日:xAIは、モデルがMASKで>50%の場合、「制御喪失」しきい値がトリガーされると述べています • 8月26日:Grok CF1は72%を獲得し、xAIはリスクはないと述べた どちらも真実のようです MASK は恐ろしいベンチマークではなく、xAI は 1 週間の間に考えを変えた理由を説明する必要があります