Un nuevo modelo de razonamiento abierto, K2-Think, fue lanzado recientemente con puntuaciones comparables a GPT-OSS 120B y ha recibido mucha atención mediática. Sin embargo, su rendimiento depende de una evaluación defectuosa marcada por la contaminación, comparaciones injustas y tergiversación de resultados. 🧵