verifiers v0.1.7 已經發布 🚀 這次的更新主要是讓 RL 訓練和實驗變得更簡單: - 單指令安裝 prime-rl - 單指令訓練,使用統一配置 - 完全重構 vf.RLTrainer,以便於開發新算法 快速演示 + 相關連結如下 :)