Добре, що це відкрита вага, але порівнювати моделі щільних і moe і дивитися лише на загальні параметри — це досить несправедливо, якщо дивитися на активні параметри, а не на загальні параметри — це вже інша історія: - GLM 4.6 (32B): на 74% менше - Minimax M2 (10B): на 92% менше - Мислення K2 (32B): на 74% менше - V3.2 (37B): на 70% менше Розмір (і загальний або активний!) тут не є правильною метрикою, у нас має бути той самий графік зі швидкістю на VLLM / Sglang