これらは最も平凡な人々の何人かです: 単体テストを嫌う同じ人々が、LLMベースのアプリケーションの評価を書くことに反対しています。 あなたが個人開発者やプロトタイプを構築しているスタートアップ企業であれば、テストや評価の作成に時間を費やすべきではありません。代わりに、できるだけ速く反復することに集中してください。 しかし、本番環境に移行して製品を拡張する準備ができたら、すぐに自動テストと評価の作成を開始する必要があります。 テスト/評価は、エージェントを構築する場合の関連性が 10 倍高く、重要なワークフローを構築する場合の関連性が 100 倍高くなります。 広範な評価範囲なしに価値のあるものを構築した人は誰もいません。