Sie haben GLM-5 gebaut, ohne sich auf große NVIDIA-Cluster zu stützen, sondern hauptsächlich auf inländische chinesische Hardware, die als Ökosystem weniger ausgereift ist. Interessanterweise haben sie hier mit Optimierungen über Quantisierung, Kerne, asynchrone Planung, Parallelität usw. wirklich clever gespielt.