Um novo modelo de raciocínio aberto, K2-Think, foi lançado recentemente com pontuações comparáveis ao GPT-OSS 120B e recebendo muita atenção da mídia. No entanto, seu desempenho depende de avaliações falhas marcadas por contaminação, comparações injustas e deturpação dos resultados. 🧵