來自 @Baidu_Inc 的 ERNIE-5.0-Preview-1203 在 LMArena 的文本基準測試中獲得了 1451 分,位居中國模型之首。 這比之前的版本上升了 +23 分,與下一個中國模型(Qwen3-max-preview,排名第 22)之間的差距相當明顯。 它在創意寫作和處理複雜的多步提示方面表現突出,這對於建立內容管道或處理細緻的指令流程有實際影響。 自己看看結果 👇