O GPT-5 acaba de ser lançado. Vamos avaliar o seu desempenho na obtenção de capacidades complexas semelhantes às da AGI: - @grok 4 (Pensamento) supera o @OpenAI GPT-5 (Alto) tanto nos testes ARC-AGI-2 (raciocínio complexo) quanto nos testes ARC-AGI-1 (menos exigentes). - A precisão superior do Grok 4 vem com custos significativamente mais altos por tarefa, variando de $2 a $4. - As variantes mais leves do GPT-5 (mini/nano) oferecem um equilíbrio entre desempenho e custo nesses benchmarks. Por favor, note que o teste ARC-AGI-3 está atualmente em andamento, e os resultados dos testes acima não implicam superioridade do modelo. h/t @arcprize
1,27K