Vaya... Airbnb acaba de convertir el soporte al cliente en un laboratorio de IA auto-mejorable 🤯 Su nuevo documento, Agent-in-the-Loop (AITL), muestra cómo incrustar la retroalimentación humana directamente dentro de los flujos de trabajo de soporte en vivo crea un ciclo de datos que reentrena el modelo cada pocas semanas, no meses. En lugar de maratones de anotación fuera de línea, AITL recopila 4 señales de retroalimentación en tiempo real de agentes humanos: • Qué respuesta de IA prefirieron • Por qué la eligieron • Si la información recuperada era relevante • Qué conocimiento faltaba Esas señales reentrenan continuamente los modelos de recuperación, clasificación y generación, reduciendo el tiempo de iteración y mejorando el rendimiento: +11.7% de recuperación de recuerdo +14.8% de precisión +8.4% de utilidad +4.5% de adopción por parte de los agentes ¿El resultado? Un sistema que aprende mientras trabaja. No más modelos estáticos. No más ciclos de reentrenamiento de meses. Así es como la IA se convierte en verdaderamente adaptativa: humanos en el bucle → agentes en el bucle → mejora infinita. Lee el documento completo: arxiv. org/abs/2510.06674