RLFactory: LLM ツールを使用するためのプラグアンドプレイ RL フレームワーク • 非同期ツール呼び出し (高速、6.8× スループット) - 分離されたトレーニングと環境(低セットアップコスト) •柔軟な報酬設計(ルール、モデル、ツールベース) • 大型モデル (Qwen3-4B > Qwen2.5-7B) を上回るパフォーマンスを発揮します。