Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
GPT-5 is zojuist uitgebracht. Laten we de prestaties evalueren in het bereiken van complexe AGI-achtige capaciteiten:
- @grok 4 (Denken) overtreft @OpenAI GPT-5 (Hoog) in zowel de ARC-AGI-2 (complex redeneren) als de ARC-AGI-1 (minder veeleisend) tests.
- De superieure nauwkeurigheid van Grok 4 gaat gepaard met aanzienlijk hogere kosten per taak, variërend van $2 tot $4.
- Lichtere GPT-5 varianten (mini/nano) bieden een evenwichtige afweging tussen prestaties en kosten op deze benchmarks.
Houd er rekening mee dat de ARC-AGI-3 test momenteel aan de gang is, en de resultaten van de bovenstaande tests impliceren niet dat het model superieur is.
h/t @arcprize

1,24K
Boven
Positie
Favorieten