Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Để thúc đẩy ranh giới mã nguồn mở cho RL + LLMs, chúng ta cần những môi trường có thể mở rộng, mô-đun với độ phức tạp của thế giới thực, vượt ra ngoài các tiêu chuẩn toán học.
Hôm nay, chúng tôi phát hành *benchmax*.
Một khung mã nguồn mở để xây dựng, chạy và mở rộng các môi trường RL hữu ích cho việc tinh chỉnh LLM, với các tích hợp vào verl & verifiers (sẽ có thêm trong thời gian tới!).

10,65K
Hàng đầu
Thứ hạng
Yêu thích