Chạy Qwen3 8B trên iPhone Air với MLX. Mô hình được lượng tử hóa thành 4-bit và hoạt động khá tốt.