RLFactory: plug-and-play RL framework pro použití LLM nástrojů • Asynchronní volání nástroje (rychlejší, 6,8 × propustnost) • Oddělené školení a prostředí (nízké náklady na nastavení) • Flexibilní design odměňování (pravidlo, model, nástroj) • Překonává větší modely (Qwen3-4B > Qwen2.5-7B)