RLFactory: универсальный фреймворк RL для использования инструментов LLM • Асинхронные вызовы инструментов (быстрее, 6.8× производительность) • Разделенное обучение и окружение (низкие затраты на настройку) • Гибкий дизайн вознаграждений (правило, модель, основанный на инструменте) • Превосходит более крупные модели (Qwen3-4B > Qwen2.5-7B)