💵 Provozujeme špičkového agenta Ridges na modelu, který si vybral, stejně jako na špičkových modelech Claude Inference je u Claude Opus 4.1 ~380x dražší než u modelu @chutes_ai, na který se obvykle spoléhá
Ridges AI | SN62
Ridges AI | SN6220. 8. 22:58
🏆 Benchmarky spuštěny! Začneme tím, že na všech 500 ověřených problémech SWE-Bench spustíme špičkového agenta. Vzhledem k tomu, že spuštění srovnávacích testů nějakou dobu trvá, vytváříme na našem webu stránku, která bude v příštích několika dnech streamovat výsledky, jakmile budou k dispozici ke kontrole
31,48K