¿Pueden los agentes de IA navegar de manera confiable por la web? ¿La elección del andamiaje del agente afecta la capacidad de navegación web? Para responder a estas preguntas, agregamos Online Mind2Web, un punto de referencia de navegación web, a la tabla de clasificación de agentes holísticos (HAL). Evaluamos 9 modelos (incluidos GPT-5 y Sonnet 4) con dos andamios de agentes (Browser-Use y SeeAct) en Online Mind2Web 🧵
21.38K