来自 @Baidu_Inc 的 ERNIE-5.0-Preview-1203 在 LMArena 的文本基准测试中获得了 1451 分,位列中国模型第 1 名。 这比之前的版本提升了 +23 分,而它与下一个中国模型(Qwen3-max-preview,排名第 22)之间的差距相当显著。 它在创意写作和处理复杂的多步骤提示方面表现突出,这对构建内容管道或处理细致的指令流程有实际影响。 亲自查看结果 👇