O ByteDance Seed apresenta o AgentGym-RL • Primeiro framework unificado de RL para treinamento de agentes em múltiplas interações (sem SFT) • Design modular e extensível para tarefas na web, busca, jogos, tarefas incorporadas e científicas • Agentes rivalizam/superam modelos comerciais em 27 tarefas