他們在沒有依賴大型 NVIDIA 集群的情況下建造了 GLM-5,而主要是基於國內的中國硬體,這個生態系統相對不成熟。有趣的是,他們在量化、內核、異步調度、並行性等方面進行了非常聰明的優化。