如果你覺得自己沒有進行足夠的實驗,瓶頸幾乎總是基礎設施,而不是想法。 專注於改善你的基礎設施: 編寫並行化代碼:許多團隊仍然使用 for 循環進行所有測試。花 1-2 小時學習編寫並行化代碼可以顯著減少你的實驗時間,從幾天縮短到幾小時。 構建模組化管道:如果你的整個 RAG 應用程序是一個巨大的 Python 文件,那麼測試將會很困難。但如果每個搜索索引都是一個單獨的 POST 請求,你就可以單獨測試它們。這使你能夠專注於一個組件(比如圖像檢索系統),並在一個下午將其準確率從 30% 提高到 80%。 儘可能在本地測試:創建較小的合成數據集以便快速迭代,然後再進行更大規模的測試。 商業影響:一位客戶通過並行化他們的評估代碼,從每週進行 1 次實驗提升到每天進行 5 次實驗。這種迭代速度的 35 倍提升直接轉化為更快的產品改進和更短的上市時間。 能夠在隔離中測試組件對於快速實驗至關重要。這很大程度上歸結於良好的軟件工程實踐和深思熟慮的系統設計。 關鍵見解:快速實驗基礎設施是一個倍增器。一次性投資於並行化和模組化,然後進行 10 倍更多的實驗。
3.37K