internet es un aula pobre para entrenar agentes web. cada clic en un sitio en vivo cuesta tiempo y arriesga un baneo. este artículo de investigación señala un camino diferente al entrenar agentes en una versión soñada de la web. utiliza un modelo predictor para aprender cómo responden los sitios web a acciones como hacer clic en botones o enviar formularios. luego, el agente realiza sesiones de navegación en su cabeza para practicar. este ensayo ocurre sin tocar un sitio real.. y parece traducirse en un rendimiento más fuerte una vez que el agente se activa. los datos de dynaweb muestran una mejora relativa del 16% en webarena y nuevos resultados sota en webvoyager. ¿veremos simuladores específicos de dominio para cada herramienta empresarial importante? enlace: arxiv. org/pdf/2601.22149v1