Чтобы продвинуть открытые источники в области RL + LLM, нам нужны масштабируемые, модульные среды с реальной сложностью, выходящей за рамки математических тестов. Сегодня мы представляем *benchmax*. Открытая платформа для создания, запуска и масштабирования полезных RL-сред для тонкой настройки LLM, с интеграциями в verl и проверяющие системы (скоро будет больше!).
10,65K