Es fühlt sich wie ein Verbrechen an, wenn man sagt, dass wir keine Laufzeitbeobachtbarkeit für KI-Systeme benötigen, während wir A/B-Tests für statischen Code benötigten, wo der Eingabebereich so gering war und jetzt fast unendlich wird. Man kann einfach nicht alle Testfälle im Voraus abdecken. Sehr guter Artikel von @benhylak
ben (is hiring engineers)
ben (is hiring engineers)6. Sept., 06:56
Ich habe gerade meinen ersten langen Beitrag über Evals geschrieben. Was sie sind, wo sie funktionieren, wo nicht und wie ich die Zukunft sehe. Wenn du ein KI-Produkt entwickelst, solltest du das lesen.
3,12K