Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
GPT-5 wurde gerade veröffentlicht. Lassen Sie uns seine Leistung bei der Erreichung komplexer AGI-ähnlicher Fähigkeiten bewerten:
- @grok 4 (Denken) übertrifft @OpenAI GPT-5 (Hoch) sowohl in den Tests ARC-AGI-2 (komplexes Denken) als auch ARC-AGI-1 (weniger anspruchsvoll).
- Die überlegene Genauigkeit von Grok 4 geht mit deutlich höheren Kosten pro Aufgabe einher, die zwischen 2 und 4 Dollar liegen.
- Leichtere GPT-5-Varianten (mini/nano) bieten einen ausgewogenen Kompromiss zwischen Leistung und Kosten bei diesen Benchmarks.
Bitte beachten Sie, dass der Test ARC-AGI-3 derzeit durchgeführt wird und die Ergebnisse der oben genannten Tests keine Modellüberlegenheit implizieren.
h/t @arcprize

1,15K
Top
Ranking
Favoriten