ByteDance Seed представляет AgentGym-RL • Первый унифицированный фреймворк RL для многоповоротного обучения агентов (без SFT) • Модульный, расширяемый дизайн для веба, поиска, игр, воплощенных и научных задач • Агенты соперничают/превосходят коммерческие модели по 27 задачам