construyeron GLM-5 sin depender de grandes clústeres NVIDIA, pero sobre todo de hardware chino doméstico, que es menos maduro como ecosistema, y curiosamente jugaron muy bien aquí con optimizaciones sobre cuantización, kernels, planificación asincrónica, paralelismo, etc.