Ось одні з найбільш посередніх людей: Ті ж люди, які ненавидять модульні тести, тепер виступають проти написання евалів для своїх додатків на основі LLM. Якщо ви одиночний розробник або стартап, який створює прототип, вам не варто витрачати свій час на написання тестів або оцінок. Натомість зосередьтеся на ітерації якомога швидше. Але як тільки ви будете готові вийти на виробництво і масштабувати свій продукт, ви повинні почати писати автоматизовані тести та евали. Тестування/евал у 10 разів актуальніші при побудові агентів і в 100 разів актуальніші при побудові критичних робочих процесів. Ніхто ніколи не будував нічого цінного без широкого висвітлення eval.