ByteDance Seed prezintă AgentGym-RL • Primul cadru RL unificat pentru instruirea agenților cu mai multe ture (fără SFT) • Design modular, extensibil pe web, căutare, jocuri, sarcini încorporate și științifice • Agenții rivalizează/depășesc modelele comerciale la 27 de sarcini