MiniMax-M2.5 NVFP4 běží na 2x RTX 6000 > 83 tokenů/s v jednom proudu > umožňuje až 32 současných uživatelů > dosahování 1000+ tokenů za sekundu > to stojí ~2x 512GB Mac Studios > kromě Mac = 1 prompt najednou > a ještě pomalejší tokeny za sekundu > model na HF > lukealonso/MiniMax-M2.5-NVFP4