ByteDance Seed presenta AgentGym-RL • Primer marco unificado de RL para el entrenamiento de agentes en múltiples turnos (sin SFT) • Diseño modular y extensible en tareas de web, búsqueda, juegos, embodiment y ciencia • Los agentes rivalizan/superan modelos comerciales en 27 tareas