热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
本周顶尖AI论文(7月28日 - 8月3日):
- GEPA
- Graph-R1
- AlphaEarth
- 自我进化代理
- 层次推理模型
- 高效注意力机制
- 几何平均策略优化
阅读更多内容:
1. AlphaEarth 基金会
AlphaEarth 基金会 (AEF) 引入了一种任务无关的地理空间基础模型,该模型学习地球表面的紧凑、时间连续的嵌入场。

2025年7月30日
我们的新人工智能模型 AlphaEarth Foundations 正在以惊人的细节绘制地球地图。🌏🔍
科学家们现在将能够更快地追踪森林砍伐的影响,监测作物健康等,得益于我们的新数据集。🧵
2. 几何平均策略优化
引入了一种稳定的替代方案,称为组相对策略优化(GRPO),广泛用于通过强化学习提高大型语言模型的推理能力。
3. 格帕
引入了一种新的优化器 GEPA,它使用自然语言反射和基于帕累托的搜索自适应地改进复合 AI 系统的提示。

2025年7月29日
提示优化与 GRPO 等 RL 算法相比如何?
GRPO 需要数千次推出,但人类可以从一些试验中吸取教训——通过反思哪些有效,哪些无效。
认识 GEPA:一种反射式提示优化器,其性能比 GRPO 高出 20%,而推出次数减少 35 倍! 🧵

5. Graph-R1
引入了一种新颖的RAG框架,超越了传统的一次性或基于块的检索,通过整合图结构知识、主动的多轮交互和强化学习。
7. 在你的提示中在哪里展示演示?
介绍了DPP偏差,这是一种在大型语言模型(LLMs)中出现的新型位置敏感性,其中演示在提示中的位置显著影响输出的准确性和稳定性。

2025年7月31日
在你的提示中应该放置演示的位置?
这篇论文发现,许多任务在提示的开始处放置演示会有好处。
如果演示放在用户消息的末尾,它们可能会翻转超过30%的预测,而不会提高正确性。
对AI开发者来说是个很好的阅读。

140.52K
热门
排行
收藏