Trendande ämnen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Förra veckan deltog våra resonemangsmodeller i 2025 International Collegiate Programming Contest (ICPC), världens främsta programmeringstävling på universitetsnivå. Vårt system löste alla 12 av 12 problem, en prestation som skulle ha placerat sig på första plats i världen (det bästa mänskliga teamet löste 11 problem).
Denna milstolpe avrundar en intensiv 2 månader lång tävling med våra modeller:
- En andraplats i AtCoder Heuristics World Finals
- Guldmedalj vid Internationella matematikolympiaden
- Guldmedalj vid den internationella olympiaden i informatik
- Och nu, en guldmedalj, en förstaplats i ICPC World Finals.
Jag tror att dessa resultat, som kommer från en familj av allmänna resonemangsmodeller som har sina rötter i vårt huvudsakliga forskningsprogram, kanske är det tydligaste riktmärket för framsteg i år. Dessa tävlingar är fantastiska fristående, tidsinrutade tester för förmågan att upptäcka nya idéer. Redan innan våra modeller var skickliga på enkel aritmetik såg vi på dessa tävlingar som milstolpar i utvecklingen mot transformativ artificiell intelligens.
Våra modeller rankas nu bland de bästa människorna inom dessa domäner, när de ställs med välspecificerade frågor och begränsas till ~5 timmar. Utmaningen nu är att gå mot mer öppna problem och mycket längre tidshorisonter. Denna nivå av slutledningsförmåga, tillämpad under månader och år på problem som verkligen betyder något, är vad vi är ute efter - att automatisera vetenskapliga upptäckter.
Denna snabba utveckling understryker också vikten av forskning om säkerhet och uppriktning. Vi behöver fortfarande mer förståelse för anpassningsegenskaperna hos långvariga resonemangsmodeller; i synnerhet rekommenderar jag att du granskar de fascinerande resultaten från studien av intrigerande i resonemangsmodeller som vi släppte idag (
Grattis till mina lagkamrater som lagt ner sina hjärtan i att få dessa tävlingsresultat, och till alla som bidrar till den underliggande grundforskningen som möjliggör dem!
Topp
Rankning
Favoriter