ByteDance Seed presenta AgentGym-RL • Primo framework RL unificato per l'addestramento di agenti multi-turno (senza SFT) • Design modulare ed estensibile per web, ricerca, giochi, compiti incarnati e scientifici • Gli agenti competono/superano i modelli commerciali in 27 compiti