O NVFP4 já está disponível no HF* Os pesos têm cerca de ~20.4GB Imagine executar isto num RTX 5090 (32GB VRAM) com quase nenhuma perda de desempenho ou precisão em comparação com 62.4GB *HF: GadflyII/GLM-4.7-Flash-NVFP4