Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
GPT-5 è stato appena rilasciato. Valutiamo le sue prestazioni nel raggiungere capacità complesse simili all'AGI:
- @grok 4 (Pensiero) supera @OpenAI GPT-5 (Alto) sia nei test ARC-AGI-2 (ragionamento complesso) che ARC-AGI-1 (meno impegnativi).
- L'accuratezza superiore di Grok 4 comporta costi significativamente più elevati per compito, che variano da $2 a $4.
- Le varianti più leggere di GPT-5 (mini/nano) offrono un compromesso equilibrato tra prestazioni e costi su questi benchmark.
Si prega di notare che il test ARC-AGI-3 è attualmente in corso e i risultati dei test sopra non implicano superiorità del modello.
h/t @arcprize

1,15K
Principali
Ranking
Preferiti