Das sind einige der mittelmäßigsten Menschen: Die gleichen Leute, die Unit-Tests hassen, sind jetzt empört über das Schreiben von Evaluierungen für ihre LLM-basierten Anwendungen. Wenn du ein Solo-Entwickler oder ein Startup bist, das einen Prototyp erstellt, solltest du deine Zeit nicht mit dem Schreiben von Tests oder Evaluierungen verbringen. Stattdessen solltest du dich darauf konzentrieren, so schnell wie möglich zu iterieren. Aber sobald du bereit bist, in die Produktion zu gehen und dein Produkt zu skalieren, musst du anfangen, automatisierte Tests und Evaluierungen zu schreiben. Tests/Evaluierungen sind 10x relevanter beim Erstellen von Agenten und 100x relevanter beim Erstellen kritischer Workflows. Niemand hat jemals etwas Wertvolles ohne umfangreiche Evaluierungsabdeckung gebaut.