La nouvelle génération de lots dans MLX LM est assez rapide. Voici 4 générations simultanées avec Qwen3 4B sur mon M4 max :