ByteDance Seed giới thiệu AgentGym-RL • Khung RL thống nhất đầu tiên cho việc đào tạo tác nhân đa lượt (không có SFT) • Thiết kế mô-đun, có thể mở rộng trên web, tìm kiếm, trò chơi, nhiệm vụ hiện thân & khoa học • Các tác nhân cạnh tranh/vượt trội hơn các mô hình thương mại trên 27 nhiệm vụ