ik heb net mijn eerste lange blogpost over evals geschreven. wat ze zijn, waar ze werken, waar ze niet werken, en hoe ik de toekomst zie. als je een AI-product bouwt, moet je dit lezen.
99,25K