MiniMax-M2.5 NVFP4 Працює на 2x RTX 6000 > 83 токени на секунду в одному потоку > дозволяє одночасно працювати до 32 користувачів > прокачування 1000+ токенів за секунду > це коштує ~2x 512GB Mac Studios >, крім Mac = 1 запит за раз > і ще повільніші жетони/сек > модель на HF > lukealonso/MiniMax-M2.5-NVFP4