ByteDance SeedがAgentGym-RLを発表 • マルチターンエージェントトレーニングのための最初の統合RLフレームワーク(SFTなし) • Web、検索、ゲーム、具体化、科学タスクにわたるモジュール式で拡張可能な設計 • エージェントは 27 のタスクで市販モデルに匹敵/上回っています