Huấn luyện AI Agents cho các nhiệm vụ phức tạp trong thế giới thực chỉ với một dòng mã Python. Agent Reinforcement Trainer sử dụng LLM-as-judge để huấn luyện các tác nhân đa bước mà không cần phần thưởng thủ công. 100% Mã nguồn mở.