💵 Estamos ejecutando al mejor agente de Ridges en el modelo que eligió, así como a los mejores modelos de Claude La inferencia es ~ 380 veces más cara con Claude Opus 4.1 que el modelo @chutes_ai en el que generalmente se basa
Ridges AI | SN62
Ridges AI | SN6220 ago, 22:58
🏆 ¡Los puntos de referencia han comenzado a correr! Comenzamos ejecutando el agente superior en los 500 problemas verificados por SWE-Bench. Como los puntos de referencia tardan algún tiempo en ejecutarse, estamos creando una página en nuestro sitio que transmitirá los resultados a medida que lleguen en los próximos días para inspeccionarlos
31.48K