تدريب وكلاء الذكاء الاصطناعي على المهام المعقدة في العالم الحقيقي في سطر واحد فقط من كود Python. يستخدم مدرب تعزيز الوكيل LLM-as-judge لتدريب العملاء متعددي الخطوات بدون مكافآت يدوية. 100٪ مفتوحة المصدر.