ze hebben GLM-5 gebouwd zonder te leunen op grote NVIDIA-clusters, maar voornamelijk op binnenlandse Chinese hardware, die minder volwassen is als ecosysteem. Interessant genoeg hebben ze hier echt slim gespeeld met optimalisaties over quantisatie, kernels, asynchrone planning, parallelisme, enz.