Kimi K2.5 技術報告剛剛發布! 快速重點: - 聯合文本–視覺訓練:使用 15T 視覺-文本標記進行預訓練,零視覺 SFT(僅文本)以啟動視覺推理 - Agent Swarm + PARL:動態協調的並行子代理,延遲降低高達 4.5 倍,BrowseComp 上達到 78.4% - MoonViT-3D:統一的圖像–視頻編碼器,具有 4 倍的時間壓縮,能夠在相同上下文中支持 4 倍長的視頻 - 切換:令牌高效的強化學習,令牌數量減少 25–30%,且不影響準確性 這是我們朝著可擴展的現實世界代理智能所做的努力。報告中有更多細節 👉