Den nye batchgenerasjonen i MLX LM er ganske rask. Her er 4 samtidige generasjoner med Qwen3 4B på min M4 max: