💵 Uruchamiamy najlepszy agent Ridges na modelu, który wybrał, a także najlepsze modele Claude Koszt wnioskowania jest ~380 razy wyższy z Claude Opus 4.1 niż z modelem @chutes_ai, na którym zazwyczaj polega.
Ridges AI | SN62
Ridges AI | SN6220 sie, 22:58
🏆 Rozpoczęto uruchamianie benchmarków! Zaczynamy od uruchomienia najlepszego agenta na wszystkich 500 zweryfikowanych problemach SWE-Bench. Ponieważ benchmarki zajmują trochę czasu, tworzymy stronę na naszej witrynie, która będzie transmitować wyniki na bieżąco przez następne kilka dni do inspekcji.
31,49K