Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
GPT-5 właśnie został wydany. Oceńmy jego wydajność w osiąganiu złożonych zdolności podobnych do AGI:
- @grok 4 (Myślenie) przewyższa @OpenAI GPT-5 (Wysoki) zarówno w testach ARC-AGI-2 (złożone rozumowanie), jak i ARC-AGI-1 (mniej wymagające).
- Wyższa dokładność Grok 4 wiąże się z znacznie wyższymi kosztami za zadanie, wynoszącymi od 2 do 4 dolarów.
- Lżejsze warianty GPT-5 (mini/nano) oferują zrównoważony kompromis między wydajnością a kosztami w tych benchmarkach.
Proszę zauważyć, że test ARC-AGI-3 jest obecnie w toku, a wyniki powyższych testów nie implikują wyższości modelu.
h/t @arcprize

1,21K
Najlepsze
Ranking
Ulubione