ByteDance Seed представляє AgentGym-RL • Перший уніфікований фреймворк RL для навчання агентів на кілька ходів (без SFT) • Модульний, розширюваний дизайн в Інтернеті, пошуку, іграх, втілених і наукових завданнях • Агенти конкурують/перевершують комерційні моделі за 27 завданнями