Nytt från ETH Zürichs SRI Lab: "Debunking K2-Think" K2-Thinks rapporterade vinster är överdrivna: felaktiga utvärderingar, kontaminering, orättvisa jämförelser, felrapporterade baslinjer. Verklighet: den presterar sämre än många öppna SotA-modeller, långt ifrån GPT-OSS / DeepSeek V3.1.