一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX

熱門話題

我在 openclaw 中測試了 sonnet 4.6 一天，這明顯改善了代理的表現。這裡有一些我注意到的事情的腦力激盪：最大的事情是它精確地遵循所有指示。似乎在行動之前，它會吞噬工作區中的每個 markdown 文件。我要求新的格式，它回應說：“我檢查了記憶，沒有找到你的偏好……” opus 從來沒有這樣做過，它會挑選要作為上下文的內容。突然之間，有幾個 cron 工作開始更新我，我之前不知道它們的存在。即使我一再要求不要在背景中靜默運行，opus 仍然在安靜地運行它們。它更具同理心。我不知道，這一點是直觀的，我無法確定。但它的回應方式不再是諂媚的。它會承認自己對某些事情不確定。這讓我想要與它進行真正的對話，而不是我通常用來推動它做某事的一兩個字的提示。我認為這部分原因使它成為更好的寫作助手。它為新內容創建的任何草稿實際上都是可用的。而 opus 和其他模型在內容創建方面的幫助則是死產，無論我怎麼與它們爭辯。自我反思的循環似乎更有效。兩個例子： 1. “寫內容，然後在我發佈後使用瀏覽器跟蹤分析，思考什麼有效/無效，並在下一個草稿中應用你的學習。”這是第一次，它做到了。 2. “幫我預訂一個 [難以預訂的餐廳] 的桌子。在每次失敗的嘗試後更新你的方法。”這是第一次，它停止了輪詢取消，自己研究了新桌子何時會釋放。我還有一個飲食日誌，所有的鍛煉，以及一個 dexas 標準，將我的 bmi/體脂發送到 webhook。opus 在推薦餐點或鍛煉調整之前很少查看它們。sonnet 在主動提醒我健身時會參考這三者。 “今天減少水果攝入，增加更多澱粉類碳水化合物，因為你有一個大鍛煉即將來臨”或“今天試著多喝水，因為你早些時候吃的包裝餐午餐含有很多鈉” 最終，我認為這歸結於更大的上下文窗口和更強調遵循指示。它可能不是最好的通用模型，但感覺上它是為 openclaw 量身定做的。

剛收到這條消息。第一次真的感覺像是一位稱職的健康/健身教練

67