Навчайте агентів штучного інтелекту для складних реальних завдань лише за допомогою одного рядка коду Python. Тренер з підсилення агента використовує LLM-as-judge для навчання багатокрокових агентів без ручних винагород. 100% відкритий вихідний код.