они построили GLM-5, не полагаясь на большие кластеры NVIDIA, а в основном на отечественное китайское оборудование, которое менее развито как экосистема, и, что интересно, они действительно проявили смекалку в оптимизациях по квантованию, ядрам, асинхронному планированию, параллелизму и т.д.