Novo do SRI Lab da ETH Zürich: "Desmistificando o K2-Think" Os ganhos reportados do K2-Think estão exagerados: avaliações falhas, contaminação, comparações injustas, linhas de base mal reportadas. Realidade: ele tem um desempenho inferior a muitos modelos abertos de SotA, longe do GPT-OSS / DeepSeek V3.1.