GPT-5 和 Opus 4.1 仍然未能通过我的评估,"AI 能为我的《阳刚的 mongoose》系列构思一个短故事吗?" 成功是 EY-困难的;我只创作了 3 个这样的故事。但 AI 的失败感觉像是非常远的失误。他们没有理解 Bruce Kent 故事的要点。
相关的短篇故事系列: 布鲁斯·肯特 #1: 布鲁斯·肯特 #2(可跳过): 布鲁斯·肯特 #3:
人工智能们开始发言: GPT-5 思考: Opus 4.1 扩展思考:
14.09K