تم إصدار 🚀 المدققين v0.1.7 هذا كل شيء عن جعل التدريب والتجريب في RL أسهل: - تثبيت أمر واحد ل prime-RL - تدريب على أمر واحد مع تكوينات موحدة - تم إصلاح VF. RLTrainer للقرصنة على خوارزميات جديدة عرض توضيحي سريع + روابط أدناه :)