MiniMax-M2.5 NVFP4 körs på 2x RTX 6000 > 83 tokens/sek enkel ström > tillåter upp till 32 samtidiga användare > att pressa 1000+ tokens/sekund > kostar detta ~2x 512GB Mac Studios > förutom Mac = 1 prompt åt gången > och ännu långsammare tokens/sec > modell på HF > lukealonso/MiniMax-M2.5-NVFP4