我在 openclaw 中測試了 sonnet 4.6 一天,這明顯改善了代理的表現。 這裡有一些我注意到的事情的腦力激盪: 最大的事情是它精確地遵循所有指示。似乎在行動之前,它會吞噬工作區中的每個 markdown 文件。 我要求新的格式,它回應說:“我檢查了記憶,沒有找到你的偏好……” opus 從來沒有這樣做過,它會挑選要作為上下文的內容。 突然之間,有幾個 cron 工作開始更新我,我之前不知道它們的存在。即使我一再要求不要在背景中靜默運行,opus 仍然在安靜地運行它們。 它更具同理心。我不知道,這一點是直觀的,我無法確定。但它的回應方式不再是諂媚的。它會承認自己對某些事情不確定。 這讓我想要與它進行真正的對話,而不是我通常用來推動它做某事的一兩個字的提示。 我認為這部分原因使它成為更好的寫作助手。它為新內容創建的任何草稿實際上都是可用的。 而 opus 和其他模型在內容創建方面的幫助則是死產,無論我怎麼與它們爭辯。 自我反思的循環似乎更有效。兩個例子: 1. “寫內容,然後在我發佈後使用瀏覽器跟蹤分析,思考什麼有效/無效,並在下一個草稿中應用你的學習。”這是第一次,它做到了。 2. “幫我預訂一個 [難以預訂的餐廳] 的桌子。在每次失敗的嘗試後更新你的方法。”這是第一次,它停止了輪詢取消,自己研究了新桌子何時會釋放。 我還有一個飲食日誌,所有的鍛煉,以及一個 dexas 標準,將我的 bmi/體脂發送到 webhook。opus 在推薦餐點或鍛煉調整之前很少查看它們。sonnet 在主動提醒我健身時會參考這三者。 “今天減少水果攝入,增加更多澱粉類碳水化合物,因為你有一個大鍛煉即將來臨”或“今天試著多喝水,因為你早些時候吃的包裝餐午餐含有很多鈉” 最終,我認為這歸結於更大的上下文窗口和更強調遵循指示。 它可能不是最好的通用模型,但感覺上它是為 openclaw 量身定做的。
剛收到這條消息。第一次真的感覺像是一位稱職的健康/健身教練
67