Heilige Scheiße... Airbnb hat den Kundenservice gerade in ein selbstverbesserndes KI-Labor verwandelt 🤯 Ihr neues Papier, Agent-in-the-Loop (AITL), zeigt, wie die Einbettung menschlichen Feedbacks direkt in die Live-Support-Workflows ein Datenflywheel schafft, das das Modell alle paar Wochen und nicht Monate neu trainiert. Anstatt Offline-Anmerkungs-Marathons sammelt AITL 4 Echtzeit-Feedback-Signale von menschlichen Agenten: • Welche KI-Antwort sie bevorzugten • Warum sie diese gewählt haben • Ob die abgerufenen Informationen relevant waren • Welches Wissen fehlte Diese Signale trainieren kontinuierlich Abruf-, Ranking- und Generierungsmodelle neu, wodurch die Iterationszeit verkürzt und die Leistung gesteigert wird: +11,7% Abruf-Rückruf +14,8% Präzision +8,4% Hilfsbereitschaft +4,5% Agentenakzeptanz Das Ergebnis? Ein System, das lernt, während es arbeitet. Keine statischen Modelle mehr. Keine monatelangen Neutrainingszyklen mehr. So wird KI wirklich anpassungsfähig: Menschen im Loop → Agenten im Loop → unendliche Verbesserung. Vollständiges Papier lesen: arxiv. org/abs/2510.06674