Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
¡Atropos v0.3 ya está disponible!
Nuestro marco de trabajo de RL Environments ha experimentado muchas actualizaciones desde la versión 0.2, algunos aspectos destacados:
- Atropos ahora puede ser utilizado como marco de evaluación comparativa y evaluación por @rogershijin, con nuestro primer punto de referencia externo, Reward-Bench 2!
- Se agregó el Gimnasio de Razonamiento, un repositorio de gimnasio de entorno externo portado a Atropos con más de 100 tareas de razonamiento de @neurosp1ke y amigos.
- @max_paperclips integrado el bootcamp de razonamiento de @intern_lm, agregando 1000+ nuevas tareas de razonamiento para RL
- @dmayhem93 el ingeniero jefe de Atropos agregó docenas de correcciones de errores y otras mejoras de confiabilidad y compatibilidad, mejor soporte para múltiples entornos y CI/CD
- Muchos de los entornos del hackathon de Atropos se han fusionado en /environments/community - enumerarlos todos ocuparía la mayor parte del espacio de la pantalla, pero algunos aspectos destacados:
VR-CLI de @JakeABoggs, Philosophy RLAIF, Adaptive LLM Teachers, WebVoyager, diseño de proteínas de @hallerite, un entorno de enrutamiento de modelos de @gabinfay, múltiples en Lean Proving, Catbot Arena, Pokemon Showdown, Poker, Helpful Doctors, poesía sánscrita de @khoomeik y mucho más.
- Otros nuevos entornos notables con soporte oficial incluyen:
Formato de respuesta siguiendo el entorno
Pydantic a JSON entorno portado desde @MatternJustus trabajo
Instrucciones Siguiendo el trabajo de @natolambert y @allen_ai
Conteo de letras
- ¡47 nuevos colaboradores!
Echa un vistazo al registro de cambios completo aquí:

18 jul 2025
Just merged a PR for an environment to improve LLM as a Judge as well as evaluate models on their capability of doing judgements!
Did you know that all verifiable RL environments are nearly equivalent to benchmarks (and vice-versa!)? So we added an evaluate command to Atropos' base and now you can run benchmarks through Atropos environments.
We got frustrated with working with so many benchmark frameworks that were outdated or unusable, so we implemented evaluation-only mode into Atropos, our RL environments framework.
So our first port from outside our existing environments was @natolambert's Reward-Bench!
Note: it only supports generative reward models (regular LLM Judges) at the moment.
Check out the PR here:

25.09K
Populares
Ranking
Favoritas