RLFactory: kerangka kerja RL plug-and-play untuk penggunaan alat LLM • Panggilan alat asinkron (lebih cepat, throughput 6,8×) • Pelatihan & lingkungan yang dipisahkan (biaya penyiapan rendah) • Desain hadiah yang fleksibel (aturan, model, berbasis alat) • Mengungguli model yang lebih besar (Qwen3-4B > Qwen2.5-7B)