新しい@openaiリリースをベンチマークする準備ができています。今すぐ: - Claudeはコーディングやツールの使用に優れています。 - ジェミニは私の頼りになる主力モデルです。 - O3 非常に具体的な推論タスクの場合、思考予算に優れたヒューリスティックがあるようです。 私の賭けは、OpenAIとGeminiは、月末までにコーディングやツールの使用に関してClaudeに近づくでしょう。
4.27K