O GPT-5 acaba de ser lançado. Vamos avaliar seu desempenho na obtenção de recursos complexos semelhantes a AGI: - @grok 4 (Pensamento) supera @OpenAI GPT-5 (Alto) nos testes ARC-AGI-2 (raciocínio complexo) e ARC-AGI-1 (menos exigente). - A precisão superior do Grok 4 vem com custos significativamente mais altos por tarefa, variando de US$ 2 a US$ 4. - Variantes GPT-5 mais leves (mini / nano) fornecem uma compensação equilibrada entre desempenho e custo nesses benchmarks. Observe que o teste ARC-AGI-3 está em andamento e os resultados dos testes acima não implicam superioridade do modelo. h / t @arcprize
1,28K