RLFactory:一個即插即用的RL框架,用於LLM工具使用 • 異步工具調用(更快,6.8×吞吐量) • 解耦的訓練與環境(低設置成本) • 靈活的獎勵設計(規則、模型、工具基礎) • 超越更大的模型(Qwen3-4B > Qwen2.5-7B)