一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动

热门话题

Connor Davis

🔥 我简直不敢相信这居然存在……有人终于写出了每个 AI 代理初创公司一直在假装的秘密手册。一个研究团队刚刚发布了《设计、开发和部署生产级代理 AI 工作流的实用指南》，这基本上是人们 *认为* OpenAI 和 Anthropic 使用的内部手册。不是炒作。不是带有可爱箭头的图表。这是一个真正的工程蓝图，适用于那些在你离开演示沙箱时不会崩溃的代理。这让人疯狂的地方在于 👇 1 / 他们首先揭示了为什么大多数代理会崩溃从来不是模型的问题。而是围绕它的系统： • 非确定性工具路由 • 静默的 MCP 失败 • 代理即兴执行顺序 • 工作流每次运行产生不同结果他们展示了原始失败痕迹——代理失误、循环或幻觉工具的实际日志。这就像是每个“自主 AI 员工”演示的尸检。 2 / 他们围绕确定性重建整个堆栈每个工具调用都变成了一个类型化函数。每个执行路径都是可重放的。每一步都是确定性的。如果系统不能两次产生相同的输出，那就不是生产级的。这一条规则就杀死了人们误认为是“涌现”的一半混乱。 3 / 他们强制执行单一责任代理没有拥有 12 种个性的超级代理。而是： • 规划者 • 推理代理 • 工具执行者 • 验证者 • 综合者每个都有严格的边界。没有幻觉工具。没有混合任务推理。没有自由职业。这是真正的后端工程，而不是角色扮演。 4 / 他们将每个提示外部化为真实配置提示不再是隐藏的字符串——它们是： • 版本控制的 • 可审计的 • 可比较的 • 可重新加载的这创造了稳定的行为，防止了不可见的回归。 5 / 他们与裁判一起运行模型联盟 GPT + Claude + Gemini 不是可以互换的。它们是合作者。每个都生成一个草稿。一个推理代理合并它们，解决矛盾，并输出统一的结果。结构化辩论，而不是模型轮盘赌。 6 / 他们将工作流引擎与 MCP 层解耦他们分开： • 编排 • 工具访问 • 重试 • 健康检查 • 扩展 • 可观察性结果：一个像微服务一样行为的代理系统，而不是一个用胶带粘合的聊天宏。 7 / 然后他们用真实的生产管道证明一切一个完整的新闻 ➝ 分析 ➝ 脚本 ➝ 推理 ➝ 音频 ➝ 视频 ➝ GitHub PR 系统。完整的图表。完整的痕迹。实际的失败。实际的修复。这是这个领域最接近于一个能够承受现实世界负载的代理的规范架构。如果你的代理堆栈没有： • 确定性工作流 • 隔离的责任 • 外部化的提示 • 多模型仲裁 • 适当的基础设施 • 完整的可观察性 ……你就不是在构建代理。你是在构建演示。这本指南是生产 AI 系统的第一个真正蓝图，并且提高了每个人的标准。