Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
La semana pasada, nuestros modelos de razonamiento participaron en el Concurso Internacional de Programación Universitaria (ICPC) 2025, la principal competencia de programación a nivel universitario del mundo. Nuestro sistema resolvió los 12 de 12 problemas, un rendimiento que habría colocado en primer lugar en el mundo (el mejor equipo humano resolvió 11 problemas).
Este hito cierra dos meses intensos de actuaciones competitivas de nuestros modelos:
- Un segundo lugar en las Finales Mundiales de Heurísticas de AtCoder
- Medalla de oro en la Olimpiada Internacional de Matemáticas
- Medalla de oro en la Olimpiada Internacional de Informática
- Y ahora, una medalla de oro, primer lugar en las Finales Mundiales del ICPC.
Creo que estos resultados, provenientes de una familia de modelos de razonamiento general arraigados en nuestro programa de investigación principal, son quizás el indicador más claro de progreso este año. Estas competiciones son grandes pruebas autoconclusivas y limitadas en el tiempo para la capacidad de descubrir nuevas ideas. Incluso antes de que nuestros modelos fueran competentes en aritmética simple, miramos hacia estos concursos como hitos de progreso hacia una inteligencia artificial transformadora.
Nuestros modelos ahora se clasifican entre los mejores humanos en estos dominios, cuando se les plantean preguntas bien especificadas y se les restringe a ~5 horas. El desafío ahora es pasar a problemas más abiertos y horizontes de tiempo mucho más largos. Este nivel de capacidad de razonamiento, aplicado durante meses y años a problemas que realmente importan, es lo que buscamos: automatizar el descubrimiento científico.
Este rápido progreso también subraya la importancia de la investigación en seguridad y alineación. Aún necesitamos más comprensión de las propiedades de alineación de los modelos de razonamiento de larga duración; en particular, recomiendo revisar los hallazgos fascinantes del estudio sobre la planificación en modelos de razonamiento que publicamos hoy.
¡Felicidades a mis compañeros de equipo que pusieron su corazón en obtener estos resultados de competencia, y a todos los que contribuyen a la investigación fundamental subyacente que los hace posibles!
Parte superior
Clasificación
Favoritos