Putain... Airbnb vient de transformer le support client en un laboratoire d'IA auto-améliorant 🤯 Leur nouvel article, Agent-in-the-Loop (AITL), montre comment l'intégration des retours humains directement dans les flux de travail de support en direct crée un flywheel de données qui réentraîne le modèle toutes les quelques semaines et non des mois. Au lieu de marathons d'annotation hors ligne, AITL collecte 4 signaux de retour en temps réel de la part des agents humains : • Quelle réponse de l'IA ils préféraient • Pourquoi ils l'ont choisie • Si les informations récupérées étaient pertinentes • Quelles connaissances manquaient Ces signaux réentraînent en continu les modèles de récupération, de classement et de génération, réduisant le temps d'itération et améliorant les performances : +11,7 % de rappel de récupération +14,8 % de précision +8,4 % d'utilité +4,5 % d'adoption par les agents Le résultat ? Un système qui apprend pendant qu'il fonctionne. Fini les modèles statiques. Fini les cycles de réentraînement de plusieurs mois. C'est ainsi que l'IA devient véritablement adaptative : humains dans la boucle → agents dans la boucle → amélioration infinie. Lire l'article complet : arxiv. org/abs/2510.06674