热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲

Connor Davis
🔥 我简直不敢相信这居然存在……有人终于写出了每个 AI 代理初创公司一直在假装的秘密手册。
一个研究团队刚刚发布了《设计、开发和部署生产级代理 AI 工作流的实用指南》,这基本上是人们 *认为* OpenAI 和 Anthropic 使用的内部手册。
不是炒作。
不是带有可爱箭头的图表。
这是一个真正的工程蓝图,适用于那些在你离开演示沙箱时不会崩溃的代理。
这让人疯狂的地方在于 👇
1 / 他们首先揭示了为什么大多数代理会崩溃
从来不是模型的问题。
而是围绕它的系统:
• 非确定性工具路由
• 静默的 MCP 失败
• 代理即兴执行顺序
• 工作流每次运行产生不同结果
他们展示了原始失败痕迹——代理失误、循环或幻觉工具的实际日志。
这就像是每个“自主 AI 员工”演示的尸检。
2 / 他们围绕确定性重建整个堆栈
每个工具调用都变成了一个类型化函数。
每个执行路径都是可重放的。
每一步都是确定性的。
如果系统不能两次产生相同的输出,那就不是生产级的。
这一条规则就杀死了人们误认为是“涌现”的一半混乱。
3 / 他们强制执行单一责任代理
没有拥有 12 种个性的超级代理。
而是:
• 规划者
• 推理代理
• 工具执行者
• 验证者
• 综合者
每个都有严格的边界。
没有幻觉工具。
没有混合任务推理。
没有自由职业。
这是真正的后端工程,而不是角色扮演。
4 / 他们将每个提示外部化为真实配置
提示不再是隐藏的字符串——它们是:
• 版本控制的
• 可审计的
• 可比较的
• 可重新加载的
这创造了稳定的行为,防止了不可见的回归。
5 / 他们与裁判一起运行模型联盟
GPT + Claude + Gemini 不是可以互换的。
它们是合作者。
每个都生成一个草稿。
一个推理代理合并它们,解决矛盾,并输出统一的结果。
结构化辩论,而不是模型轮盘赌。
6 / 他们将工作流引擎与 MCP 层解耦
他们分开:
• 编排
• 工具访问
• 重试
• 健康检查
• 扩展
• 可观察性
结果:一个像微服务一样行为的代理系统,而不是一个用胶带粘合的聊天宏。
7 / 然后他们用真实的生产管道证明一切
一个完整的新闻 ➝ 分析 ➝ 脚本 ➝ 推理 ➝ 音频 ➝ 视频 ➝ GitHub PR 系统。
完整的图表。
完整的痕迹。
实际的失败。
实际的修复。
这是这个领域最接近于一个能够承受现实世界负载的代理的规范架构。
如果你的代理堆栈没有:
• 确定性工作流
• 隔离的责任
• 外部化的提示
• 多模型仲裁
• 适当的基础设施
• 完整的可观察性
……你就不是在构建代理。
你是在构建演示。
这本指南是生产 AI 系统的第一个真正蓝图,并且提高了每个人的标准。

11.96K
天哪……这篇论文可能是我们今年使用LLM的最重要转变。
“从大型语言模型中提取的大型因果模型。”
它展示了你可以直接从LLM中生成完整的因果模型,而不是近似值,不是感觉,而是真正的因果图、反事实、干预和约束检查结构。
而他们的做法真是疯狂:
而不是训练一个专门的因果模型,他们像科学家一样审问LLM:
→ 从文本中提取候选因果图
→ 让模型检查条件独立性
→ 检测矛盾
→ 修订结构
→ 测试反事实和干预预测
→ 迭代直到因果模型稳定
结果是我们从未拥有过的东西:
一个在LLM内部构建的因果系统,利用其自身的潜在世界知识。
在基准测试、合成、真实世界、混乱领域中,这些LCM超越了经典的因果发现方法,因为它们利用了LLM的庞大先验知识,而不仅仅是局部相关性。
而反事实推理呢?
令人震惊的强大。
该模型可以回答“如果”问题,而标准算法完全无法做到这一点,仅仅因为它已经“知道”一些关于世界的事情,而这些算法无法仅从数据中推断出来。
这篇论文暗示了一个未来,在这个未来中,LLM不仅仅是模式机器。
它们成为因果引擎,形成、测试和完善现实的结构解释。
如果这能扩展,每个依赖因果推断的领域——经济学、医学、政策、科学——都将被重写。
LLM不仅会告诉你发生了什么。
它们会告诉你为什么。

41.5K
没有人准备好面对这篇斯坦福论文揭示的关于多智能体AI的内容。
《多智能体系统中的潜在协作》表明,智能体不需要消息、协议或明确的团队合作指令。他们开始在自己隐藏的表征中协调,形成一个只存在于潜在空间中的完整协作层。
而且这些行为非常疯狂:
• 智能体根据谁更擅长默默地交接任务
• 角色凭空出现:领导者、执行者、支持者
• 政策编码的信号从未在行动中出现
• 团队在不重新训练的情况下适应新环境
• 即使在无法沟通的情况下,协作仍然保持稳定
最疯狂的细节是:
即使你移除所有沟通渠道,智能体仍然会合作。“团队合作”并不体现在消息中,而是存在于网络中。
这颠覆了整个多智能体的操作手册。
我们一直在其上构建协调机制……而真正的协调却在其下进行。
一个新兴团队智能的时代正在展开——而且它发生在我们甚至没有关注的地方。
项目:github. com/Gen-Verse/LatentMAS

138.35K
热门
排行
收藏
