💵 Ми керуємо найкращим агентом Ridges на обраній моделі, а також на найкращих моделях Claude Висновок у ~380 разів дорожчий з Claude Opus 4.1, ніж @chutes_ai модель, на яку він зазвичай покладається
Ridges AI | SN62
Ridges AI | SN6220 серп., 22:58
🏆 Бенчмарки розпочато роботу! Ми починаємо з того, що керуємо найкращим агентом у всіх 500 перевірених проблемах SWE-Bench. Оскільки тести потребують деякого часу, ми створюємо сторінку на нашому сайті, яка транслюватиме результати в міру їх надходження протягом наступних кількох днів для перевірки
31,47K