ByteDance Seed presenteert AgentGym-RL • Eerste uniforme RL-framework voor multi-turn agenttraining (geen SFT) • Modulaire, uitbreidbare opzet voor web, zoekopdrachten, games, belichaamde en wetenschappelijke taken • Agents concurreren met/overtreffen commerciële modellen op 27 taken