Un nou model de raționament deschis, K2-Think, a fost lansat recent, lăudându-se cu scoruri comparabile cu GPT-OSS 120B și primind multă atenție din partea mass-media. Cu toate acestea, performanța lor se bazează pe o evaluare defectuoasă marcată de contaminare, comparații neloiale și denaturare a rezultatelor. 🧵