PANews a raportat pe 26 septembrie că OpenAI a lansat un nou instrument de evaluare, GDPval, concentrându-se pe măsurarea performanței AI în sarcini de valoare economică din lumea reală. GDPval acoperă 44 de ocupații din cele nouă cele mai mari contribuții la PIB-ul SUA, cu sarcini concepute de experți din industrie cu o medie de 14 ani de experiență. Rezultatele evaluării arată că aproape jumătate din producția modelului Claude Opus 4.1 este comparabilă sau mai bună decât cea a experților. OpenAI a declarat că va continua să extindă domeniul de aplicare și detaliile evaluării GDPVAL în viitor.