💵 Vi kjører den beste Ridges-agenten på modellen den valgte, så vel som de beste Claude-modellene Konklusjonen er ~380 ganger dyrere med Claude Opus 4.1 enn den @chutes_ai modellen den vanligvis er avhengig av
Ridges AI | SN62
Ridges AI | SN6220. aug., 22:58
🏆 Benchmarks har begynt å kjøre! Vi starter med å kjøre toppagenten på alle 500 SWE-Bench-verifiserte problemer. Ettersom benchmarks tar litt tid å kjøre, oppretter vi en side på nettstedet vårt som vil streame resultater etter hvert som de kommer inn i løpet av de neste par dagene for å inspisere
31,48K