Misschien de meest overtuigende GPT-5 benchmark: het was vergelijkbaar met menselijke experts bij ongeveer de helft van de taken op het gebied van complexe, economisch waardevolle kenniswerk in verschillende domeinen.
2,76K