Toinen avoimen lähdekoodin SOTA-malli 👍 355B-parametreilla (32B aktiivinen MoE) se on hieman pienempi kuin jotkut näkemämme ~1T-mallit. AFAIK he eivät kerro, mitä laitteistoa käytettiin tämän mallin kouluttamiseen, mutta he käyttivät 23T-koulutustokeneita. IIUC sekä Alibaba että Tencent ovat sijoittajia, jotka ovat startup-yritys Pekingissä.
Z.ai
Z.ai11.8.2025
GLM-4.5 teknisen raportin esittelyssä! 👇 Tämä työ osoittaa, kuinka kehitimme malleja, jotka ovat erinomaisia päättelyssä, koodauksessa ja agenttitehtävissä ainutlaatuisen, monivaiheisen koulutusparadigman avulla. Keskeisiä innovaatioita ovat asiantuntijamallien iteraatio itsetislauksella kykyjen yhdistämiseksi, hybridipäättelytila dynaamiseen ongelmanratkaisuun ja vaikeuspohjainen vahvistusoppimisen opetussuunnitelma.
7K