вони створили GLM-5 без великих кластерів NVIDIA, а здебільшого на внутрішньому китайському апаратному забезпеченні, яке менш зріле як екосистема, і цікаво, що тут вони дуже розумно оптимізували квантування, ядра, асинхронне планування, паралелізм тощо.