Я готовий провести бенчмарк нового @openai релізу. Прямо зараз: - Клод відмінно підходить для кодування і використання інструментів. - Близнюки – моя модель для роботи. - O3 для дуже конкретних завдань на міркування, схоже, вони мають хорошу евристику щодо бюджету мислення. Я впевнений, що OpenAI і Gemini наблизяться до Клода в питаннях кодування або використання інструментів до кінця місяця.
4,27K