RLFactory: ein Plug-and-Play-RL-Framework für die Nutzung von LLM-Tools • Asynchrone Toolaufrufe (schneller, 6,8× Durchsatz) • Entkoppelte Ausbildung & Umgebung (geringe Einrichtungskosten) • Flexibles Belohnungsdesign (regel-, modell- und toolbasiert) • Übertrifft größere Modelle (Qwen3-4B > Qwen2.5-7B)