Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
GPT-5 har nettopp blitt utgitt. La oss evaluere ytelsen for å oppnå komplekse AGI-lignende evner:
- @grok 4 (Tenkning) overgår @OpenAI GPT-5 (Høy) i både ARC-AGI-2 (kompleks resonnement) og ARC-AGI-1 (mindre krevende) tester.
- Grok 4s overlegne nøyaktighet kommer med betydelig høyere kostnader per oppgave, fra $2 til $4.
- Lettere GPT-5-varianter (mini/nano) gir en balansert avveining mellom ytelse og kostnad på disse referansene.
Vær oppmerksom på at ARC-AGI-3-testen for tiden er i gang, og resultatene av testene ovenfor innebærer ikke modelloverlegenhet.
h/t @arcprize

1,1K
Topp
Rangering
Favoritter