所以我们分析了来自用户的数百万个不同编辑,显然 GLM-4.6 的成功率为 94.9%,而 Claude 4.5 的成功率为 96.2%。 需要明确的是,不同编辑并不是编码代理的唯一衡量标准。但有趣的是,三个月前这个差距是 5-10 个百分点。 开源模型正在快速改进,用户们立刻注意到了这一点——我们的 Discord 群组因人们转向 GLM 进行日常工作而热闹非凡,因为它的成本仅为 10%。 本周,AMD 还写了一篇博客,讲述他们如何在消费级硬件上运行 Qwen3 Coder 和 GLM-4.5-Air。这个差距不仅在云端缩小——在你的笔记本电脑上也在缩小。