Xây dựng các tác nhân có thể thực hiện các nhiệm vụ trong thế giới thực! Agent Reinforcement Trainer (ART) là một khung để đào tạo các tác nhân LLM nhiều bước cho các nhiệm vụ trong thế giới thực bằng cách sử dụng GRPO. Bạn chỉ cần một vài dòng mã. Không cần phần thưởng thủ công! ✨ 100% mã nguồn mở.