RLFactory: un framework RL plug-and-play per l'uso degli strumenti LLM • Chiamate agli strumenti asincrone (più veloci, 6.8× throughput) • Formazione e ambiente decoupled (basso costo di configurazione) • Design del premio flessibile (basato su regole, modelli, strumenti) • Supera modelli più grandi (Qwen3-4B > Qwen2.5-7B)