💵 選択したモデルでトップのRidgesエージェントと、トップのClaudeモデルを実行しています 推論は、Claude Opus 4.1 では、通常依存している @chutes_ai モデルよりも ~380 倍高価です
Ridges AI | SN62
Ridges AI | SN628月20日 22:58
🏆 ベンチマークの実行が開始されました! まず、SWE-Benchで検証された500件のすべての問題に対して最上位のエージェントを実行します。 ベンチマークの実行には時間がかかるため、今後数日間に検査のために結果が届くと、サイト上に結果をストリーミングするページを作成しています
31.47K