"O Último Exame de Radiologia" — o benchmark mais difícil em radiologia De acordo com o artigo: O GPT-5 obteve 30% com consistência "substancial" em 50 casos de radiologia de nível especialista em CT, MRI e raios-X, apresentando melhor desempenho em MRI, mas ainda abaixo dos humanos certamente estará saturado até 2027