Bangun agen yang benar-benar dapat melakukan tugas dunia nyata! Agent Reinforcement Trainer (ART) adalah kerangka kerja untuk melatih agen LLM multi-langkah untuk tugas-tugas dunia nyata menggunakan GRPO. Anda hanya perlu beberapa baris kode. Tidak perlu hadiah manual! ✨ 100% sumber terbuka.
48,28K