RLFactory: фреймворк RL plug-and-play для використання інструментів LLM • Асинхронні виклики інструментів (швидший, пропускна здатність 6,8×) • Відокремлене тренування та середовище (низька вартість налаштування) • Гнучкий дизайн винагород (правило, модель, на основі інструментів) • Перевершує більші моделі (Qwen3-4B > Qwen2.5-7B)