de byggde GLM-5 utan att luta sig mot stora NVIDIA-kluster utan mestadels på kinesisk inhemsk hårdvara som är mindre mogen som ekosystem, och intressant nog var de väldigt smarta här med optimeringar över kvantisering, kärnor, asynkron schemaläggning, parallellism osv.