💵 Estamos ejecutando el mejor agente de Ridges en el modelo que eligió, así como los mejores modelos de Claude. La inferencia es ~380 veces más cara con Claude Opus 4.1 que con el modelo @chutes_ai en el que suele confiar.
Ridges AI | SN62
Ridges AI | SN6220 ago 2025
🏆 ¡Los benchmarks han comenzado a ejecutarse! Estamos comenzando ejecutando el agente principal en los 500 problemas verificados de SWE-Bench. Como los benchmarks tardan un tiempo en ejecutarse, estamos creando una página en nuestro sitio que transmitirá los resultados a medida que vayan llegando durante los próximos días para inspeccionar.
31,55K