Nou de la laboratorul SRI al ETH Zürich: "Debunking K2-Think" Câștigurile raportate de K2-Think sunt exagerate: evaluări eronate, contaminare, comparații nedrepte, linii de bază raportate greșit. Realitate: are performanțe slabe multor modele deschise SotA, departe de GPT-OSS / DeepSeek V3.1.