我注意到,由於(我想?)在長期任務上進行大量基準最大化,LLM(大型語言模型)變得有點過於自主,超出了我平均的使用案例。 例如在編碼方面,這些模型現在傾向於推理相當長的時間,它們有一種傾向,開始在整個代碼庫中列出和搜尋文件,進行重複的網絡搜索,過度分析和過度思考一些即使在明顯不完整且正在積極開發的代碼中的小型稀有邊緣情況,並且即使對於簡單的查詢,經常會在幾分鐘後才回來。 這對於長時間運行的任務可能是有意義的,但對於我仍然經常進行的更“在循環中”的迭代開發來說,這就不太合適了,或者如果我只是想在運行腳本之前進行快速檢查,以防我有一些索引錯誤或犯了一些愚蠢的錯誤。因此,我經常會用變體來停止LLM,例如“停下來,你想得太多了。只看這個單一文件。不要使用任何工具。不要過度設計”等等。 基本上,隨著默認設置慢慢滲透到“超思考”超自主模式中,我感到需要相反的東西,更普遍地說,需要良好的方式來指示或傳達意圖/風險,從“只是快速看一下”一直到“離開30分鐘,當絕對確定時再回來”。
125.7K