La nuova generazione di batch in MLX LM è piuttosto veloce. Ecco 4 generazioni simultanee con Qwen3 4B sul mio M4 max: