Talvez o benchmark mais convincente do GPT-5: foi comparável a especialistas humanos em cerca de metade das tarefas em trabalhos de conhecimento complexos e economicamente valiosos em uma variedade de domínios.
2,76K