Để thúc đẩy ranh giới mã nguồn mở cho RL + LLMs, chúng ta cần những môi trường có thể mở rộng, mô-đun với độ phức tạp của thế giới thực, vượt ra ngoài các tiêu chuẩn toán học. Hôm nay, chúng tôi phát hành *benchmax*. Một khung mã nguồn mở để xây dựng, chạy và mở rộng các môi trường RL hữu ích cho việc tinh chỉnh LLM, với các tích hợp vào verl & verifiers (sẽ có thêm trong thời gian tới!).
10,65K