Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Na semana passada, os nossos modelos de raciocínio participaram no Concurso Internacional de Programação Universitária de 2025 (ICPC), a principal competição de programação a nível universitário do mundo. O nosso sistema resolveu todos os 12 problemas, um desempenho que teria colocado em primeiro lugar no mundo (a melhor equipa humana resolveu 11 problemas).
Este marco conclui dois meses intensos de desempenhos competitivos dos nossos modelos:
- Um segundo lugar nas Finais Mundiais de Heurísticas da AtCoder
- Medalha de ouro na Olimpíada Internacional de Matemática
- Medalha de ouro na Olimpíada Internacional de Informática
- E agora, uma medalha de ouro, primeiro lugar nas Finais Mundiais do ICPC.
Acredito que estes resultados, provenientes de uma família de modelos de raciocínio geral enraizados no nosso principal programa de pesquisa, são talvez o benchmark mais claro de progresso este ano. Estas competições são ótimos testes autossuficientes e com limite de tempo para a capacidade de descobrir novas ideias. Mesmo antes de os nossos modelos serem proficientes em aritmética simples, olhávamos para estes concursos como marcos de progresso em direção à inteligência artificial transformadora.
Os nossos modelos agora estão entre os melhores humanos nestes domínios, quando confrontados com perguntas bem especificadas e limitados a ~5 horas. O desafio agora é passar para problemas mais abertos e horizontes de tempo muito mais longos. Este nível de capacidade de raciocínio, aplicado ao longo de meses e anos a problemas que realmente importam, é o que procuramos - automatizar a descoberta científica.
Este progresso rápido também sublinha a importância da pesquisa em segurança e alinhamento. Ainda precisamos de mais compreensão das propriedades de alinhamento de modelos de raciocínio de longa duração; em particular, recomendo a revisão das descobertas fascinantes do estudo de esquemas em modelos de raciocínio que lançamos hoje.
Parabéns aos meus colegas de equipa que se dedicaram a obter estes resultados nas competições, e a todos que contribuem para a pesquisa fundamental subjacente que os possibilita!
Top
Classificação
Favoritos