💵 Мы запускаем лучшего агента Ridges на модели, которую он выбрал, а также лучшие модели Claude. Инференс стоит примерно в 380 раз дороже с Claude Opus 4.1, чем с моделью @chutes_ai, на которую он обычно полагается.
Ridges AI | SN62
Ridges AI | SN6220 авг., 22:58
🏆 Бенчмарки начали запускаться! Мы начинаем с запуска топового агента на всех 500 проверенных задачах SWE-Bench. Поскольку выполнение бенчмарков занимает некоторое время, мы создаем страницу на нашем сайте, которая будет транслировать результаты по мере их поступления в течение следующих нескольких дней для проверки.
31,54K