O PANews informou em 26 de setembro que a OpenAI lançou uma nova ferramenta de avaliação, GDPval, com foco em medir o desempenho da IA em tarefas de valor econômico do mundo real. O GDPval abrange 44 ocupações nos nove maiores contribuintes para o PIB dos EUA, com tarefas projetadas por especialistas do setor com uma média de 14 anos de experiência. Os resultados da avaliação mostram que quase metade da produção do modelo Claude Opus 4.1 é comparável ou melhor do que a dos especialistas. A OpenAI disse que continuará a expandir o escopo e os detalhes da avaliação do GDPVAL no futuro.