Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
La scorsa settimana, i nostri modelli di ragionamento hanno partecipato al Concorso Internazionale di Programmazione Universitaria (ICPC) 2025, la principale competizione di programmazione a livello universitario al mondo. Il nostro sistema ha risolto tutti e 12 i problemi, una prestazione che avrebbe garantito il primo posto nel mondo (il miglior team umano ha risolto 11 problemi).
Questo traguardo conclude due mesi intensi di prestazioni competitive dei nostri modelli:
- Un secondo posto alle Finali Mondiali di AtCoder Heuristics
- Medaglia d'oro alle Olimpiadi Matematiche Internazionali
- Medaglia d'oro alle Olimpiadi Internazionali di Informatica
- E ora, una medaglia d'oro, primo posto alle Finali Mondiali ICPC.
Credo che questi risultati, provenienti da una famiglia di modelli di ragionamento generale radicati nel nostro principale programma di ricerca, siano forse il benchmark più chiaro dei progressi di quest'anno. Queste competizioni sono ottimi test autonomi e a tempo limitato per la capacità di scoprire nuove idee. Anche prima che i nostri modelli fossero competenti in aritmetica semplice, guardavamo a questi concorsi come traguardi di progresso verso un'intelligenza artificiale trasformativa.
I nostri modelli ora si collocano tra i migliori umani in questi ambiti, quando vengono posti di fronte a domande ben specificate e limitati a circa 5 ore. La sfida ora è passare a problemi più aperti e a orizzonti temporali molto più lunghi. Questo livello di capacità di ragionamento, applicato per mesi e anni a problemi che contano davvero, è ciò che stiamo cercando: automatizzare la scoperta scientifica.
Questo rapido progresso sottolinea anche l'importanza della ricerca sulla sicurezza e sull'allineamento. Abbiamo ancora bisogno di una maggiore comprensione delle proprietà di allineamento dei modelli di ragionamento a lungo termine; in particolare, consiglio di rivedere i risultati affascinanti dello studio sul complottare nei modelli di ragionamento che abbiamo rilasciato oggi (
Congratulazioni ai miei compagni di squadra che hanno messo il cuore per ottenere questi risultati nelle competizioni, e a tutti coloro che contribuiscono alla ricerca fondamentale sottostante che li rende possibili!
Principali
Ranking
Preferiti