Ich bin bereit, die neue @openai-Version zu benchmarken. Im Moment: - Claude ist hervorragend für Programmierung und Werkzeugnutzung. - Gemini ist mein bevorzugtes Arbeitsmodell. - O3 für sehr spezifische Denkaufgaben, es sieht so aus, als hätten sie gute Heuristiken für das Denkbudget. Meine Wette ist, dass OpenAI und Gemini bis Ende des Monats in der Programmierung oder Werkzeugnutzung nahe an Claude herankommen werden.
4,27K