Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Na semana passada, nossos modelos de raciocínio participaram do International Collegiate Programming Contest (ICPC) de 2025, a principal competição de programação de nível universitário do mundo. Nosso sistema resolveu todos os 12 dos 12 problemas, um desempenho que teria ficado em primeiro lugar no mundo (a melhor equipe humana resolveu 11 problemas).
Este marco completa 2 meses intensos de performances competitivas de nossos modelos:
- Um segundo lugar nas Finais Mundiais de Heurística AtCoder
- Medalha de ouro na Olimpíada Internacional de Matemática
- Medalha de ouro na Olimpíada Internacional de Informática
- E agora, uma medalha de ouro, o primeiro lugar nas Finais Mundiais do ICPC.
Acredito que esses resultados, provenientes de uma família de modelos gerais de raciocínio enraizados em nosso principal programa de pesquisa, são talvez a referência mais clara de progresso este ano. Essas competições são ótimos testes independentes e com caixa de tempo para a capacidade de descobrir novas ideias. Mesmo antes de nossos modelos serem proficientes em aritmética simples, olhávamos para esses concursos como marcos do progresso em direção à inteligência artificial transformadora.
Nossos modelos agora estão entre os principais humanos nesses domínios, quando colocados com perguntas bem especificadas e restritos a ~ 5 horas. O desafio agora é mudar para problemas mais abertos e horizontes de tempo muito mais longos. Esse nível de capacidade de raciocínio, aplicado ao longo de meses e anos a problemas que realmente importam, é o que buscamos - automatizar a descoberta científica.
Esse rápido progresso também ressalta a importância da pesquisa de segurança e alinhamento. Ainda precisamos de mais compreensão das propriedades de alinhamento dos modelos de raciocínio de longa duração; em particular, recomendo revisar as descobertas fascinantes do estudo de esquemas em modelos de raciocínio que lançamos hoje (
Parabéns aos meus companheiros de equipe que se dedicaram a obter os resultados dessas competições e a todos que contribuíram para a pesquisa fundamental subjacente que os capacita!
Melhores
Classificação
Favoritos