ÇOK HEYECAN: Huggingface'de ilk Minimax m2.5 NVFP4 quant. 83tok/s tek akış vllm çift RTX 6000 ile. Ya da yarı fiyatlı bir Mac 512gb sistemin yaklaşık iki katı hızında. Ama Mac 32+ eşzamanlı bağlantı üzerinden 1000+ tok/s yapamıyor. Bu test için GPU başına güç sınırı @ 550W. lukealonso/MiniMax-M2.5-NVFP4 Görsel alt metinde kullandığım vllm tarifi