Nouveau du SRI Lab de l'ETH Zurich : « Déboulonner K2-Think » Les gains rapportés de K2-Think sont exagérés : évaluations défectueuses, contamination, comparaisons injustes, bases de référence mal rapportées. Réalité : il sous-performe de nombreux modèles open SotA, loin de GPT-OSS / DeepSeek V3.1.