لا يزال GPT-5 و Opus 4.1 يفشلانان في eval ، "هل يمكن ل الذكاء الاصطناعي أن يرسم قصة قصيرة لسلسلة النمس المذكر الخاصة بي؟" النجاح صعب. لقد قمت بتأليف 3 قصص فقط من هذا القبيل. لكن إخفاقات الذكاء الاصطناعي تبدو وكأنها أخطاء بعيدة جدا. لم يفهموا الهدف من قصة بروس كينت.
سلسلة القصص القصيرة المعنية: بروس كينت # 1: بروس كينت # 2 (قابل للتخطي): بروس كينت # 3:
الذكاء الاصطناعي يأخذ لقطاتهم: تفكير GPT-5: Opus 4.1 التفكير الموسع:
‏‎13.7‏K