verifiers v0.1.7 已发布 🚀 这次更新主要是为了让 RL 训练和实验变得更加简单: - 单命令安装 prime-rl - 单命令训练,使用统一配置 - 全面改进 vf.RLTrainer,以便于开发新算法 快速演示 + 下面的链接 :)