GPT-5 heeft net Pokémon Red voltooid! 6.470 stappen tegen 18.184 voor o3! Bekijk de stats-site om te vergelijken! Dat is een enorme verbetering! Goed gedaan, @OpenAI, je hebt gekookt met GPT-5. Wat een ongelooflijk model. Volgende: GPT-5 vs. Pokémon Crystal (16 Badges + Red). De run begint binnenkort op Twitch.
Clad3815
Clad381514 aug, 14:39
GPT-5 heeft de Victory Road bereikt! Dit is de laatste uitdaging voordat de Elite Four. GPT-5 heeft dit deel bijna drie keer sneller bereikt dan o3 (6105 stappen voor GPT-5 versus 16882 stappen voor o3). Hier zijn mijn observaties waarom: - GPT-5 hallucineert veel minder dan o3. Dit is de belangrijkste reden voor de snelheidstoename. - GPT-5 heeft een betere ruimtelijke redenering. o3 probeerde vaak met brute kracht door muren te komen en had moeite met het navigeren door complexe gebieden. GPT-5 kan lange invoersequenties plannen met weinig fouten, wat veel tijd bespaart. - GPT-5 is beter in het plannen van zijn eigen doelstellingen en het volgen daarvan. Laten we zien hoe het deze laatste uitdaging aanpakt!
224,85K