Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
La semana pasada, nuestros modelos de razonamiento participaron en el Concurso Internacional de Programación Universitaria (ICPC) 2025, la principal competencia de programación a nivel universitario del mundo. Nuestro sistema resolvió los 12 de los 12 problemas, un rendimiento que habría colocado el primer lugar en el mundo (el mejor equipo humano resolvió 11 problemas).
Este hito completa 2 meses intensos de actuaciones en competición de nuestros modelos:
- Un segundo puesto en las finales mundiales de Heurística de AtCoder
- Medalla de oro en la Olimpiada Internacional de Matemáticas
- Medalla de oro en la Olimpiada Internacional de Informática
- Y ahora, una medalla de oro, el primer puesto en las Finales Mundiales del CIPC.
Creo que estos resultados, provenientes de una familia de modelos de razonamiento general arraigados en nuestro programa de investigación principal, son quizás el punto de referencia más claro del progreso de este año. Estas competiciones son excelentes pruebas autónomas y con un límite de tiempo para la capacidad de descubrir nuevas ideas. Incluso antes de que nuestros modelos dominaran la aritmética simple, mirábamos hacia estos concursos como hitos del progreso hacia la inteligencia artificial transformadora.
Nuestros modelos ahora se encuentran entre los mejores humanos en estos dominios, cuando se les plantean preguntas bien especificadas y se restringen a ~ 5 horas. El desafío ahora es pasar a problemas más abiertos y horizontes de tiempo mucho más largos. Este nivel de capacidad de razonamiento, aplicado durante meses y años a problemas que realmente importan, es lo que buscamos: automatizar el descubrimiento científico.
Este rápido progreso también subraya la importancia de la investigación de seguridad y alineación. Todavía necesitamos una mayor comprensión de las propiedades de alineación de los modelos de razonamiento de larga duración; en particular, recomiendo revisar los fascinantes hallazgos del estudio de la intriga en los modelos de razonamiento que publicamos hoy (
¡Felicitaciones a mis compañeros de equipo que pusieron su corazón en obtener estos resultados de la competencia, y a todos los que contribuyeron a la investigación fundamental subyacente que los permite!
Populares
Ranking
Favoritas