一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX

熱門話題

Connor Davis

🔥 我無法相信這個存在……有人終於寫出了每個 AI 代理初創公司一直在假裝的秘密手冊。一個研究團隊剛剛發布了《設計、開發和部署生產級代理 AI 工作流程的實用指南》，這基本上是人們 *認為* OpenAI 和 Anthropic 使用的內部手冊。不是炒作。不是帶有可愛箭頭的圖表。這是一個真正的工程藍圖，對於那些在你離開演示沙盒時不會崩潰的代理。這裡是讓它瘋狂的原因 👇 1 / 他們首先揭示為什麼大多數代理會崩潰從來不是模型。而是周圍的系統： • 非確定性工具路由 • 靜默的 MCP 故障 • 代理即興執行順序 • 工作流程每次運行產生不同結果他們展示了原始失敗痕跡——實際的代理錯誤、循環或幻覺工具的日誌。這就像是每個「自主 AI 員工」演示的解剖。 2 / 他們圍繞確定性重建整個堆棧每個工具調用都變成一個類型函數。每個執行路徑都是可重播的。每一步都是確定性的。如果系統不能兩次產生相同的輸出，那就不是生產級的。這條規則單獨就消除了人們誤認為是「出現」的混亂的一半。 3 / 他們強制單一責任代理沒有擁有 12 種個性的超級代理。而是： • 計劃者 • 推理代理 • 工具執行者 • 驗證者 • 合成者每個都有嚴格的界限。沒有幻覺工具。沒有混合任務推理。沒有自由職業。這是後端工程，而不是角色扮演。 4 / 他們將每個提示外部化為真正的配置提示不再是隱藏的字符串——它們是： • 版本控制的 • 可審計的 • 可比較的 • 可重新加載的這創造了穩定的行為並防止了不可見的回歸。 5 / 他們運行一個模型聯盟，並有一個裁判 GPT + Claude + Gemini 不是可以互換的。它們是合作者。每個都產生一個草稿。一個推理代理合併它們，解決矛盾，並輸出統一的結果。結構化辯論，而不是模型輪盤。 6 / 他們將工作流程引擎與 MCP 層解耦他們分開： • 協調 • 工具訪問 • 重試 • 健康檢查 • 擴展 • 可觀察性結果：一個像微服務一樣運作的代理系統，而不是一個用膠帶粘合的聊天宏。 7 / 然後他們用真正的生產管道證明一切一個完整的新聞 ➝ 分析 ➝ 腳本 ➝ 推理 ➝ 音頻 ➝ 視頻 ➝ GitHub PR 系統。完整的圖表。完整的痕跡。實際的失敗。實際的修復。這是這個領域最接近於一個能夠承受現實世界負載的代理的經典架構。如果你的代理堆棧沒有： • 確定性工作流程 • 隔離的責任 • 外部化的提示 • 多模型仲裁 • 正確的基礎設施 • 完整的可觀察性 ……你不是在構建代理。你是在構建演示。這本指南是生產 AI 系統的第一個真正藍圖，並且提高了每個人的標準。