26 сентября PANews сообщил, что OpenAI запустила новый инструмент оценки GDPval, ориентированный на измерение производительности ИИ в реальных задачах экономической ценности. GDPval охватывает 44 профессии в девяти крупнейших источниках ВВП США, а задачи разработаны отраслевыми экспертами со средним опытом работы 14 лет. Результаты оценки показывают, что почти половина результатов модели Claude Opus 4.1 сопоставима или превосходит продукцию экспертов. OpenAI заявила, что продолжит расширять масштабы и детали оценки GDPVAL в будущем.