хорошо, что это открытый вес, но сравнивать модели dense и moe, смотря только на общее количество параметров, довольно несправедливо. Если посмотреть на активные параметры вместо общего количества параметров, это совсем другая история: - GLM 4.6 (32B): на 74% меньше - Minimax M2 (10B): на 92% меньше - K2 thinking (32B): на 74% меньше - V3.2 (37B): на 70% меньше размер (как общий, так и активный!) не является правильной метрикой здесь, нам следует иметь тот же график со скоростью на vllm / sglang