ByteDance Seed apresenta AgentGym-RL • Primeira estrutura unificada de RL para treinamento de agentes de vários turnos (sem SFT) • Design modular e extensível na web, pesquisa, jogos, tarefas incorporadas e científicas • Agentes rivalizam / superam modelos comerciais em 27 tarefas