Prezentujemy raport techniczny GLM-4.5!👇 Ta praca pokazuje, jak opracowaliśmy modele, które doskonale radzą sobie z rozumowaniem, kodowaniem i zadaniami agentowymi dzięki unikalnemu, wieloetapowemu paradygmatowi szkoleniowemu. Kluczowe innowacje obejmują iterację modeli eksperckich z samodystylacją w celu zjednoczenia możliwości, hybrydowy tryb rozumowania do dynamicznego rozwiązywania problemów oraz program nauczania oparty na trudności w uczeniu przez wzmocnienie.
141,78K