熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁

Connor Davis
🔥 我無法相信這個存在……有人終於寫出了每個 AI 代理初創公司一直在假裝的秘密手冊。
一個研究團隊剛剛發布了《設計、開發和部署生產級代理 AI 工作流程的實用指南》,這基本上是人們 *認為* OpenAI 和 Anthropic 使用的內部手冊。
不是炒作。
不是帶有可愛箭頭的圖表。
這是一個真正的工程藍圖,對於那些在你離開演示沙盒時不會崩潰的代理。
這裡是讓它瘋狂的原因 👇
1 / 他們首先揭示為什麼大多數代理會崩潰
從來不是模型。
而是周圍的系統:
• 非確定性工具路由
• 靜默的 MCP 故障
• 代理即興執行順序
• 工作流程每次運行產生不同結果
他們展示了原始失敗痕跡——實際的代理錯誤、循環或幻覺工具的日誌。
這就像是每個「自主 AI 員工」演示的解剖。
2 / 他們圍繞確定性重建整個堆棧
每個工具調用都變成一個類型函數。
每個執行路徑都是可重播的。
每一步都是確定性的。
如果系統不能兩次產生相同的輸出,那就不是生產級的。
這條規則單獨就消除了人們誤認為是「出現」的混亂的一半。
3 / 他們強制單一責任代理
沒有擁有 12 種個性的超級代理。
而是:
• 計劃者
• 推理代理
• 工具執行者
• 驗證者
• 合成者
每個都有嚴格的界限。
沒有幻覺工具。
沒有混合任務推理。
沒有自由職業。
這是後端工程,而不是角色扮演。
4 / 他們將每個提示外部化為真正的配置
提示不再是隱藏的字符串——它們是:
• 版本控制的
• 可審計的
• 可比較的
• 可重新加載的
這創造了穩定的行為並防止了不可見的回歸。
5 / 他們運行一個模型聯盟,並有一個裁判
GPT + Claude + Gemini 不是可以互換的。
它們是合作者。
每個都產生一個草稿。
一個推理代理合併它們,解決矛盾,並輸出統一的結果。
結構化辯論,而不是模型輪盤。
6 / 他們將工作流程引擎與 MCP 層解耦
他們分開:
• 協調
• 工具訪問
• 重試
• 健康檢查
• 擴展
• 可觀察性
結果:一個像微服務一樣運作的代理系統,而不是一個用膠帶粘合的聊天宏。
7 / 然後他們用真正的生產管道證明一切
一個完整的新聞 ➝ 分析 ➝ 腳本 ➝ 推理 ➝ 音頻 ➝ 視頻 ➝ GitHub PR 系統。
完整的圖表。
完整的痕跡。
實際的失敗。
實際的修復。
這是這個領域最接近於一個能夠承受現實世界負載的代理的經典架構。
如果你的代理堆棧沒有:
• 確定性工作流程
• 隔離的責任
• 外部化的提示
• 多模型仲裁
• 正確的基礎設施
• 完整的可觀察性
……你不是在構建代理。
你是在構建演示。
這本指南是生產 AI 系統的第一個真正藍圖,並且提高了每個人的標準。

11.96K
天啊……這篇論文可能是我們今年使用 LLM 的最重要轉變。
「來自大型語言模型的大型因果模型。」
它顯示你可以直接從 LLM 中生成完整的因果模型,而不是近似值,不是感覺,而是真正的因果圖、反事實、干預和約束檢查結構。
而他們的做法非常驚人:
不再訓練專門的因果模型,而是像科學家一樣質詢 LLM:
→ 從文本中提取候選因果圖
→ 要求模型檢查條件獨立性
→ 偵測矛盾
→ 修訂結構
→ 測試反事實和干預預測
→ 迭代直到因果模型穩定
結果是我們從未擁有過的東西:
一個在 LLM 內部構建的因果系統,利用其自身的潛在世界知識。
在基準測試、合成、現實世界、混亂領域中,這些 LCM 超越了傳統的因果發現方法,因為它們利用了 LLM 的龐大先驗知識,而不僅僅是局部相關性。
而反事實推理呢?
驚人地強大。
該模型可以回答「如果」問題,而標準算法完全無法做到這一點,僅僅因為它已經「知道」一些關於世界的事情,而這些算法無法僅從數據中推斷。
這篇論文暗示了一個未來,LLM 不僅僅是模式機器。
它們成為因果引擎,形成、測試和完善現實的結構解釋。
如果這能擴展,每個依賴因果推斷的領域——經濟學、醫學、政策、科學——都將被重寫。
LLM 不僅告訴你發生了什麼。
它們會告訴你為什麼。

41.5K
沒有人準備好面對這篇斯坦福論文揭示的多代理人工智慧。
《多代理系統中的潛在協作》顯示,代理不需要消息、協議或明確的團隊合作指示。他們開始在自己隱藏的表徵中協調,形成一個只存在於潛在空間的完整協作層。
而且行為非常瘋狂:
• 代理根據誰更擅長靜默地交接任務
• 角色無中生有,領導者、執行者、支持者
• 政策編碼的信號從未在行動中出現
• 團隊在不重新訓練的情況下適應新環境
• 即使在無法溝通的情況下,協作仍然保持穩定
最瘋狂的細節:
即使你移除所有的溝通渠道,代理仍然會合作。這種“團隊合作”並不存在於消息中。它存在於網絡中。
這顛覆了整個多代理的操作手冊。
我們一直在其上構建協調機制……
而真正的協調卻在下面進行。
一個新興的團隊智慧時代正在展開——而且它發生在我們甚至沒有注意到的地方。
項目:github. com/Gen-Verse/LatentMAS

138.35K
熱門
排行
收藏
