Kimi K2.5の技術レポートが公開されました! クイックヒット: - テキスト・視覚共同トレーニング:15T視覚テキストトークン、ゼロビジョンSFT(テキストのみ)で事前学習し、視覚推論を活性化します - エージェントスウォーム + PARL:動的にオーケストレーションされた並列サブエージェントで、最大4.5×低遅延、BrowseCompで78.4% - MoonViT-3D:4×時間圧縮を備えた統一画像・映像エンコーダで、同じ文脈で4×長尺の動画を可能にします。 - トグル:トークン効率の高いRL、25〜30%少ないトークン数で精度低下なし こちらが、スケーラブルで現実世界のエージェント・インテリジェンスに向けた私たちの取り組みです。詳細は報告👉書に記載されています