Om de open source grens voor RL + LLM's te verleggen, hebben we schaalbare, modulaire omgevingen nodig met complexiteit uit de echte wereld, voorbij wiskundige benchmarks. Vandaag brengen we *benchmax* uit. Een open-source framework om nuttige RL-omgevingen te bouwen, uit te voeren en op te schalen voor LLM-fijnstelling, met integraties naar verl & verifiers (meer komt binnenkort!).
10,66K