先週、私たちの推論モデルは、世界有数の大学レベルのプログラミングコンテストである2025年国際大学プログラミングコンテスト(ICPC)に参加しました。私たちのシステムは、12 の問題のうち 12 の問題をすべて解決し、世界 1 位になるパフォーマンスでした (最高の人間のチームが 11 の問題を解決しました)。 このマイルストーンは、私たちのモデルによる2か月間の激しい競技パフォーマンスを締めくくります。 - AtCoder Heuristics World Finalsで2位に入賞 - 国際数学オリンピック金メダル - 国際情報学オリンピック金メダル - そして今、ICPCワールドファイナルで金メダル、1位フィニッシュ。 これらの結果は、私たちの主要な研究プログラムに根ざした一連の一般的な推論モデルから得られたものであり、おそらく今年の進歩の最も明確なベンチマークであると信じています。これらのコンテストは、新しいアイデアを発見する能力のための優れた自己完結型のタイムボックステストです。私たちのモデルが単純な算術に習熟する前から、私たちはこれらのコンテストを革新的な人工知能への進歩のマイルストーンとして見ていました。 私たちのモデルは現在、明確に指定された質問を投げかけ、~5時間に制限された場合、これらの領域でトップの人間にランクされています。現在の課題は、よりオープンエンドの問題と、より長い時間軸に移行することです。このレベルの推論能力は、本当に重要な問題に数か月から数年にわたって適用され、私たちが目指しているのは、科学的発見の自動化です。 この急速な進歩は、安全性とアライメントの研究の重要性も強調しています。長期実行推論モデルのアライメント特性について、さらに理解する必要があります。特に、本日リリースした推論モデルにおける陰謀の研究から得られた興味深い発見を確認することをお勧めします( このようなコンテスト結果を得るために心を注いだチームメイトと、それを可能にする基礎研究に貢献しているすべての人、おめでとうございます!