Novo do SRI Lab da ETH Zürich: "Desmascarando o K2-Think" Os ganhos relatados da K2-Think são exagerados: avaliações falhas, contaminação, comparações injustas, linhas de base mal relatadas. Realidade: ele tem um desempenho inferior a muitos modelos abertos SotA, longe do GPT-OSS / DeepSeek V3.1.