Mierda... Airbnb acaba de convertir la atención al cliente en un laboratorio 🤯 de IA de automejora Su nuevo artículo, Agent-in-the-Loop (AITL), muestra cómo la incorporación de comentarios humanos directamente dentro de los flujos de trabajo de soporte en vivo crea un volante de datos que vuelve a entrenar el modelo cada pocas semanas, no meses. En lugar de maratones de anotaciones fuera de línea, AITL recopila 4 señales de retroalimentación en tiempo real de agentes humanos: • Qué respuesta de IA preferían • Por qué lo eligieron • Si la información recuperada era relevante • Qué conocimientos faltaban Esas señales vuelven a entrenar continuamente los modelos de recuperación, clasificación y generación, lo que reduce el tiempo de iteración y aumenta el rendimiento: +11,7% de recuperación +14,8 % de precisión +8.4% de utilidad +4,5% de adopción de agentes ¿El resultado? Un sistema que aprende mientras funciona. No más modelos estáticos. No más ciclos de reentrenamiento de meses. Así es como la IA se convierte en humanos verdaderamente adaptativos en el bucle → agentes en el bucle → una mejora infinita. Lea el artículo completo: arxiv. org/abs/2510.06674