Apresentando o relatório técnico GLM-4.5! 👇 Este trabalho demonstra como desenvolvemos modelos que se destacam em raciocínio, codificação e tarefas agenciais por meio de um paradigma de treinamento único e em vários estágios. As principais inovações incluem iteração de modelo especialista com autodestilação para unificar recursos, um modo de raciocínio híbrido para resolução dinâmica de problemas e um currículo de aprendizado por reforço baseado em dificuldade.
142,6K