Estas son algunas de las personas más mediocres: Las mismas personas que odian las pruebas unitarias ahora están en armas contra la escritura de evaluaciones para sus aplicaciones basadas en LLM. Si eres un desarrollador en solitario o una startup que construye un prototipo, no debes dedicar tu tiempo a escribir pruebas o evaluaciones. En su lugar, concéntrese en iterar lo más rápido que pueda. Pero tan pronto como esté listo para pasar a producción y escalar su producto, debe comenzar a escribir pruebas y evaluaciones automatizadas. Las pruebas/evaluaciones son 10 veces más relevantes cuando se crean agentes y 100 veces más relevantes cuando se crean flujos de trabajo críticos. Nadie ha construido nada de valor sin una amplia cobertura de evaluación.