NVFP4 现在在 HF* 上可用 权重约为 20.4GB 想象一下在 RTX 5090(32GB VRAM)上运行它 几乎没有性能或准确性的损失,相比之下是 62.4GB *HF: GadflyII/GLM-4.7-Flash-NVFP4