MiniMax-M2.5 NVFP4 運行於 2x RTX 6000 > 單流每秒 83 個標記 > 允許最多 32 位同時用戶 > 推送超過 1000 個標記/秒 > 這大約花費 ~2x 512GB Mac Studios > 除了 Mac = 每次 1 個提示 > 而且每秒標記速度更慢 > 模型在 HF > lukealonso/MiniMax-M2.5-NVFP4