جديد من مختبر SRI في ETH Zürich: "فضح K2-Think" مكاسب K2-Think المبلغ عنها مبالغ فيها: عمليات الاستقبال المعيبة ، والتلوث ، والمقارنات غير العادلة ، وخطوط الأساس التي تم الإبلاغ عنها بشكل خاطئ. الحقيقة: إنه ضعيف الأداء في العديد من طرازات SotA المفتوحة ، بعيدا عن GPT-OSS / DeepSeek V3.1.