verifiers v0.1.7 wurde veröffentlicht 🚀 dieses Update dreht sich alles darum, das RL-Training und die Experimentierung viel einfacher zu gestalten: - Installation von prime-rl mit einem einzigen Befehl - Training mit einem einzigen Befehl und einheitlichen Konfigurationen - Überarbeiteter vf.RLTrainer zum Experimentieren mit neuen Algorithmen schnelle Demo + Links unten :)