Entrena agentes de IA para tareas complejas del mundo real en solo una línea de código Python. El Entrenador de Refuerzo de Agentes utiliza LLM como juez para entrenar agentes de múltiples pasos sin recompensas manuales. 100% de código abierto.