ByteDance Seed presenta AgentGym-RL • Primer marco unificado de RL para la formación de agentes de varios turnos (sin SFT) • Diseño modular y extensible en web, búsqueda, juegos, tareas corporales y científicas • Los agentes rivalizan / superan los modelos comerciales en 27 tareas