Vi presenterar den tekniska rapporten GLM-4.5! 👇 Detta arbete visar hur vi utvecklade modeller som utmärker sig vid resonemang, kodning och agentiska uppgifter genom ett unikt träningsparadigm i flera steg. Viktiga innovationer inkluderar expertmodelliteration med självdestillation för att förena kapaciteter, ett hybridresonemangsläge för dynamisk problemlösning och en svårighetsbaserad läroplan för förstärkningsinlärning.
142,6K