Açık ağırlıklı olması güzel, ama yoğun ve MOE modelleri karşılaştırıp sadece toplam parametrelere bakmak oldukça adaletsiz, aktif parametrelere bakarsanız durum bambaşka bir durum: - GLM 4.6 (32B): %74 daha az - Minimax M2 (10B): %92 daha az - K2 düşüncesi (32B): %74 daha az - V3.2 (37B): %70 daha az Boyut (hem toplam hem aktif!) burada doğru metrik değil, vllm / sglang'de aynı grafiği hızla birlikte kullanmalıyız