• 20 Agustus: xAI mengatakan jika sebuah model >50% pada MASK, itu memicu ambang batas "kehilangan kendali"
• 26 Agustus: Grok CF1 mendapat 72% dan xAI mengatakan itu tidak menimbulkan risiko
Tampaknya MASK yang benar bukanlah tolok ukur yang menakutkan dan xAI harus menjelaskan mengapa mereka berubah pikiran selama seminggu