MiniMax-M2.5 NVFP4 rodando em 2x RTX 6000 > 83 tokens/seg fluxo único > permite até 32 usuários simultâneos > empurrando 1000+ tokens/seg > isso custa ~2x Mac Studios de 512GB > exceto Mac = 1 prompt por vez > e tokens ainda mais lentos por segundo > modelo no HF > Lukealonso/MiniMax-M2.5-NVFP4