RLFactory: un marco de RL plug-and-play para el uso de herramientas LLM • Llamadas a herramientas asíncronas (más rápidas, 6,8× de rendimiento) • Capacitación y entorno desacoplados (bajo costo de instalación) • Diseño flexible de recompensas (basado en reglas, modelos, herramientas) • Supera a los modelos más grandes (Qwen3-4B > Qwen2.5-7B)