GPT-5 dan Opus 4.1 masih gagal dalam eval saya, "Bisakah AI merencanakan cerita pendek untuk seri Masculine Mongoose saya?" Kesuksesan itu sulit untuk EY; Saya hanya menyusun 3 cerita seperti itu. Tapi kegagalan AI terasa seperti sangat jauh meleset. Mereka tidak mengerti maksud dari cerita Bruce Kent.
Seri cerita pendek yang dimaksud: Bruce Kent #1: Bruce Kent #2 (dapat dilewati): Bruce Kent #3:
AI mengambil bidikan mereka: Pemikiran GPT-5: Opus 4.1 Pemikiran Diperluas:
14,09K