ByteDance Seed présente AgentGym-RL • Premier cadre RL unifié pour l'entraînement d'agents multi-tours (pas de SFT) • Conception modulaire et extensible pour le web, la recherche, les jeux, les tâches incarnées et scientifiques • Les agents rivalisent/surpassent les modèles commerciaux sur 27 tâches