GROOT KV-CACHE GEHEUGEN FIX Los het KV-cache probleem van GLM-4.7-Flash op met deze enkele regel wijziging in vLLM 200K context neemt nu ~10GB VRAM in plaats van ~180GB NVFP4 is nu op HF* - ~20,4GB gewichten - Bijna geen verlies ten opzichte van 62,4GB BF16 Dit SOTA-model draait nu op eén enkele RTX 5090 (32GB VRAM) > met de volledige 200K context > VRAM nog over *HF: GadflyII/GLM-4.7-Flash-NVFP4