Laporan teknologi Kimi K2.5 baru saja dijatuhkan! Pukulan cepat: - Pelatihan teks-visi bersama: dilatih sebelumnya dengan token teks penglihatan 15T, SFT visi nol (hanya teks) untuk mengaktifkan penalaran visual - Agent Swarm + PARL: sub-agen paralel yang diatur secara dinamis, hingga 4,5× latensi lebih rendah, 78,4% di BrowseComp - MoonViT-3D: encoder gambar-video terpadu dengan kompresi temporal 4×, memungkinkan video 4× lebih panjang dalam konteks yang sama - Toggle: RL hemat token, token 25–30% lebih sedikit tanpa penurunan akurasi Berikut adalah pekerjaan kami menuju kecerdasan agen dunia nyata yang dapat diskalakan. Detail selengkapnya dalam laporan 👉