今週のトップAI論文(7月28日〜8月3日): - GEPAの - グラフ-R1 - アルファアース - 自己進化エージェント - 階層的推論モデル - 効率的な注意メカニズム - 幾何平均ポリシーの最適化 詳細については以下をお読みください:
1. アルファアース財団 AlphaEarth Foundations(AEF)は、地球の表面のコンパクトで時間連続的な埋め込み場を学習する、タスクに依存しない地理空間基盤モデルを導入しています。
Google DeepMind
Google DeepMind2025年7月30日
当社の新しい AI モデル AlphaEarth Foundations は、地球を驚くほど詳細にマッピングしています。🌏🔍 科学者は、新しいデータセットのおかげで、森林破壊の影響を追跡したり、作物の健康状態を監視したりすることができるようになります。🧵
2. 幾何平均ポリシーの最適化 強化学習を介して大規模言語モデルの推論能力を向上させるために広く使用されているグループ相対ポリシー最適化(GRPO)の安定した代替手段を導入します。
3. ゲパ 自然言語リフレクションとパレートベースの検索を使用して、複合AIシステムのプロンプトを適応的に改善する新しいオプティマイザーGEPAを導入します。
Lakshya A Agrawal
Lakshya A Agrawal2025年7月29日
プロンプト最適化は、GRPO などの RL アルゴとどのように比較されますか? GRPOには何千回ものロールアウトが必要ですが、人間は、何がうまくいったのか、何がうまくいかなかったのかを振り返ることで、いくつかの試行から学ぶことができます。 GEPAは、35倍のロールアウトでGRPOを最大20%上回るリフレクティブ・プロンプト・オプティマイザーです。 🧵
5. グラフ-R1 グラフ構造化された知識、エージェントのマルチターン相互作用、およびRLを統合することにより、従来のワンショットまたはチャンクベースの検索を超える新しいRAGフレームワークを導入します。
elvis
elvis2025年7月30日
グラフ-R1 新しいRAGフレームワークがリリースされました! エージェント、GraphRAG、RL を組み合わせます。 私のメモは次のとおりです。
7. プロンプトのどこにデモを表示しますか? 大規模言語モデル (LLM) における新しい種類の位置感度である DPP バイアスを導入し、プロンプト内のデモンストレーションの場所が出力の精度と安定性に大きく影響します。
elvis
elvis2025年7月31日
プロンプトのどこにデモンストレーションを入れますか? このホワイトペーパーでは、多くのタスクがプロンプトの開始時にデモの恩恵を受けることを発見しました。 デモをユーザーメッセージの最後に配置すると、正確性を向上させることなく、予測の30%以上を反転させることができます。 AI 開発者にとって素晴らしい読み物です。
140.53K