這些人都是一些平庸的人: 那些討厭單元測試的人現在又對為他們基於 LLM 的應用程序編寫評估感到憤怒。 如果你是一個獨立開發者或一個正在構建原型的初創公司,你不應該花時間編寫測試或評估。相反,專注於儘快迭代。 但是,一旦你準備好投入生產並擴展你的產品,你就必須開始編寫自動化測試和評估。 在構建代理時,測試/評估的相關性提高了 10 倍,而在構建關鍵工作流程時則提高了 100 倍。 沒有人能在沒有廣泛評估覆蓋的情況下構建出有價值的東西。