NVFP4 hiện đã có trên HF* Dung lượng khoảng ~20.4GB Hãy tưởng tượng chạy điều này trên một RTX 5090 (32GB VRAM) với gần như không mất mát về hiệu suất hoặc độ chính xác so với 62.4GB *HF: GadflyII/GLM-4.7-Flash-NVFP4