2.9K ⭐️ 验证者是一个用于创建 RL 环境和训练 LLM 代理的模块化组件库。📖 @willccbb #starhistory #GitHub #开源
10.98K