RLFactory: een plug-and-play RL-framework voor LLM-toolgebruik • Asynchrone toolaanroepen (sneller, 6,8× doorvoer) • Ontkoppelde training & omgeving (lage opstartkosten) • Flexibel beloningsontwerp (regel-, model-, tool-gebaseerd) • Presteert beter dan grotere modellen (Qwen3-4B > Qwen2.5-7B)