Talvez o benchmark GPT-5 mais atraente: era comparável a especialistas humanos em ~ metade das tarefas em trabalhos de conhecimento complexos e economicamente valiosos em uma variedade de domínios.
2,76K