Новое поколение пакетов в MLX LM довольно быстрое. Вот 4 одновременных генерации с Qwen3 4B на моем M4 max: