verifiers v0.1.7 est sorti 🚀 celui-ci est entièrement consacré à rendre l'entraînement et l'expérimentation en RL beaucoup plus faciles : - installation en une seule commande pour prime-rl - entraînement en une seule commande avec des configurations unifiées - vf.RLTrainer complètement remanié pour expérimenter de nouveaux algorithmes démonstration rapide + liens ci-dessous :)