RLFactory: một khung RL plug-and-play cho việc sử dụng công cụ LLM • Gọi công cụ bất đồng bộ (nhanh hơn, thông lượng 6.8×) • Đào tạo & môi trường tách rời (chi phí thiết lập thấp) • Thiết kế phần thưởng linh hoạt (dựa trên quy tắc, mô hình, công cụ) • Vượt trội hơn các mô hình lớn hơn (Qwen3-4B > Qwen2.5-7B)