GPT-5 is zojuist uitgebracht. Laten we de prestaties evalueren in het bereiken van complexe AGI-achtige capaciteiten: - @grok 4 (Denken) overtreft @OpenAI GPT-5 (Hoog) in zowel de ARC-AGI-2 (complex redeneren) als de ARC-AGI-1 (minder veeleisend) tests. - De superieure nauwkeurigheid van Grok 4 gaat gepaard met aanzienlijk hogere kosten per taak, variërend van $2 tot $4. - Lichtere GPT-5 varianten (mini/nano) bieden een evenwichtige afweging tussen prestaties en kosten op deze benchmarks. Houd er rekening mee dat de ARC-AGI-3 test momenteel aan de gang is, en de resultaten van de bovenstaande tests impliceren niet dat het model superieur is. h/t @arcprize
1,24K