cline-bench 的設計旨在幫助開源實驗室在真實的編碼工作上進行訓練和評估,而不僅僅是經過清理的基準測試。 這就是為什麼它與後訓練領域的領導者如 @Teknium(@nousresearch 的後訓練負責人)產生共鳴。 該基準提供了一組具有挑戰性的、經過驗證的編碼環境,這些環境直接來自開發者在開源項目中使用編碼代理的方式。