Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
La semaine dernière, nos modèles de raisonnement ont participé au Concours International de Programmation Collégiale (ICPC) 2025, la première compétition de programmation au niveau universitaire au monde. Notre système a résolu tous les 12 problèmes sur 12, une performance qui aurait placé la première au monde (la meilleure équipe humaine a résolu 11 problèmes).
Cette étape clôture deux mois intenses de performances en compétition de nos modèles :
- Une deuxième place lors des finales mondiales d'AtCoder Heuristics
- Médaille d'or à l'Olympiade Mathématique Internationale
- Médaille d'or à l'Olympiade Internationale d'Informatique
- Et maintenant, une médaille d'or, une première place aux finales mondiales de l'ICPC.
Je crois que ces résultats, provenant d'une famille de modèles de raisonnement général ancrés dans notre programme de recherche principal, sont peut-être le meilleur indicateur de progrès cette année. Ces compétitions sont d'excellents tests autonomes et limités dans le temps pour la capacité à découvrir de nouvelles idées. Même avant que nos modèles ne soient compétents en arithmétique simple, nous avons considéré ces concours comme des jalons de progrès vers une intelligence artificielle transformative.
Nos modèles se classent désormais parmi les meilleurs humains dans ces domaines, lorsqu'ils sont confrontés à des questions bien spécifiées et limités à environ 5 heures. Le défi maintenant est de passer à des problèmes plus ouverts et à des horizons temporels beaucoup plus longs. Ce niveau de capacité de raisonnement, appliqué sur des mois et des années à des problèmes qui comptent vraiment, est ce que nous recherchons - automatiser la découverte scientifique.
Ce progrès rapide souligne également l'importance de la recherche sur la sécurité et l'alignement. Nous avons encore besoin de mieux comprendre les propriétés d'alignement des modèles de raisonnement à long terme ; en particulier, je recommande de revoir les résultats fascinants de l'étude sur la planification dans les modèles de raisonnement que nous avons publiés aujourd'hui.
Félicitations à mes coéquipiers qui ont mis tout leur cœur pour obtenir ces résultats en compétition, et à tous ceux qui contribuent à la recherche fondamentale sous-jacente qui les rend possibles !
Meilleurs
Classement
Favoris