Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
O GPT-5 acaba de ser lançado. Vamos avaliar o seu desempenho na obtenção de capacidades complexas semelhantes às da AGI:
- @grok 4 (Pensamento) supera o @OpenAI GPT-5 (Alto) tanto nos testes ARC-AGI-2 (raciocínio complexo) quanto nos testes ARC-AGI-1 (menos exigentes).
- A precisão superior do Grok 4 vem com custos significativamente mais altos por tarefa, variando de $2 a $4.
- As variantes mais leves do GPT-5 (mini/nano) oferecem um equilíbrio entre desempenho e custo nesses benchmarks.
Por favor, note que o teste ARC-AGI-3 está atualmente em andamento, e os resultados dos testes acima não implicam superioridade do modelo.
h/t @arcprize

1,27K
Top
Classificação
Favoritos