"L'Ultimo Esame di Radiologia" — il benchmark più difficile in radiologia Secondo il documento: GPT-5 ha ottenuto il 30% con una coerenza "sostanziale" su 50 casi di radiologia a livello esperto tra CT, MRI e raggi X, ottenendo i risultati migliori su MRI ma ancora al di sotto degli esseri umani sicuramente sarà saturo entro il 2027