ils ont construit GLM-5 sans s'appuyer sur de grands clusters NVIDIA mais principalement sur du matériel chinois domestique qui est moins mature en tant qu'écosystème et, de manière intéressante, ils ont joué très intelligemment ici avec des optimisations sur la quantification, les noyaux, la planification asynchrone, le parallélisme, etc.