MERKITTÄVÄ KV-VÄLIMUISTIN KORJAUS Korjaa GLM-4.7-Flashin KV-välimuisti tämän yksittäisen rivin muutoksen myötä vLLM:ssä 200K konteksti vie nyt ~10GB VRAMia ~180GB sijaan NVFP4 on nyt HF*:llä* - ~20,4GB painot - Lähes nollahäviö verrattuna 62,4GB BF16:een Tämä SOTA-malli toimii nyt yksi RTX 5090 (32GB VRAM) > täyden 200 000 dollarin kontekstin kanssa > VRAMia vielä jäljellä *HF: GadflyII/GLM-4.7-Flash-NVFP4