Un nuovo modello di ragionamento aperto, K2-Think, è stato recentemente rilasciato vantando punteggi comparabili a GPT-OSS 120B e attirando molta attenzione da parte dei media. Tuttavia, le loro prestazioni si basano su una valutazione difettosa segnata da contaminazione, confronti ingiusti e rappresentazione errata dei risultati. 🧵