Internet es un aula pobre para formar agentes web. Cada clic en un sitio en directo cuesta tiempo y conlleva un baneo. Este artículo de investigación apunta a un camino diferente entrenando a los agentes en una versión soñada de la web. Utiliza un modelo predictor para aprender cómo responden los sitios web a acciones como pulsar botones o enviar formularios. Luego el agente dirige mentalmente sesiones de navegación para practicar. Este ensayo ocurre sin tocar un lugar real... Y parece traducirse en un rendimiento más sólido una vez que el agente se activa. Los datos de Dynaweb muestran una mejora relativa del 16% en Webarena y nuevos resultados de SOTA en WebVoyager. ¿Veremos simuladores específicos de dominio para todas las grandes herramientas empresariales? Enlace: arxiv. org/pdf/2601.22149v1