熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
中國將超越美國在人工智慧方面的實力。
他們剛剛發布了一個開源模型,在推理基準測試中超越了GPT-5和Claude。
來自Moonshot AI的Kimi K2 Thinking在「人類的最後考試」中得分44.9%,而GPT-5僅得33%。在競爭性編程中擊敗了Claude Sonnet 4.5。在代理搜索和編碼任務中壓倒了兩者。
這不是某個研究實驗室的演示。該模型能在沒有人工干預的情況下執行200-300次連續工具調用,擁有256K的上下文窗口,並於昨天在他們的平台上上線,提供完整的API訪問。
Moonshot AI是一家成立兩年的初創公司,由前清華大學研究人員創立。沒有國家支持。沒有中共的資金印刷他們的運營資金。只有200名在北京的工程師在構建實際有效的測試時間擴展。
模型權重目前在Hugging Face上。開源。任何人都可以運行它。
當美國的人工智慧實驗室在安全表演和監管捕獲上爭鬥時,中國正在比我們能基準測試的速度更快地發送生產級推理模型。
DeepSeek教會了他們如何便宜地訓練,現在Moonshot展示了如何在不燒掉1億美元的情況下擴展推理。
這個差距正在比任何人想承認的更快地縮小。
熱門
排行
收藏

