中国将在人工智能领域超越美国。 他们刚刚发布了一个开源模型,在推理基准测试中超越了GPT-5和Claude。 Moonshot AI的Kimi K2 Thinking在“人类最后的考试”中得分44.9%,而GPT-5仅得33%。在竞争编程中击败了Claude Sonnet 4.5。在代理搜索和编码任务中也压倒了这两者。 这不是某个研究实验室的演示。该模型可以在没有人工干预的情况下执行200-300次顺序工具调用,具有256K的上下文窗口,并于昨天在他们的平台上上线,提供完整的API访问。 Moonshot AI是一家成立两年的初创公司,由前清华大学研究人员创办。没有国家支持。没有中共的资金印刷他们的运营资金。只有200名在北京的工程师在构建真正有效的测试时间扩展。 模型权重现在在Hugging Face上。开源。任何人都可以运行它。 当美国的人工智能实验室在安全表演和监管捕获上争斗时,中国正在比我们能基准测试的速度更快地推出生产级推理模型。 DeepSeek教会了他们如何低成本训练,现在Moonshot展示了如何在不烧掉1亿美元的情况下扩展推理。 这个差距正在比任何人想承认的更快地缩小。