中国はAIで米国を上回るだろう。 彼らは、推論ベンチマークでGPT-5とClaudeを上回るオープンソースモデルをドロップしたばかりです。 Moonshot AI の Kimi K2 Thinking は、GPT-5 が 33% にとどまったのに対し、Humanity's Last Exam で 44.9% を記録しました。競争力のあるプログラミングでクロードソネット4.5を破る。エージェント検索とコーディングタスクの両方で粉砕されました。 これは研究室のデモではありません。このモデルは、人間の干渉なしに200〜300のシーケンシャルツール呼び出しを実行し、256Kのコンテキストウィンドウを持ち、昨日、完全なAPIアクセスでプラットフォーム上で稼働しました。 Moonshot AI は、元清華大学の研究者によって設立された創業 2 年のスタートアップです。州の支援はありません。中国共産党の資金は滑走路を印刷していない。北京のわずか200人のエンジニアが、実際に機能するテスト時のスケーリングを構築しています。 モデルの重みは現在、Hugging Faceにあります。オープンソース。誰でも実行できます。 アメリカのAI研究所が安全劇場と規制の獲得をめぐって争っている一方で、中国は本番グレードの推論モデルをベンチマークするよりも速く出荷しています。 DeepSeek は彼らに安価なトレーニング方法を教えましたが、Moonshot はトレーニング実行ごとに $100M を消費せずに推論を拡張する方法を示しました。 この差は誰もが認めたいよりも早く縮まりつつあります。