Технічний звіт Kimi K2.5 щойно з'явився! Швидкі вказівки: - Спільне навчання тексту та зору: попередньо навчені з 15T vision-text tokens, нульовий зір SFT (лише текстове) для активації візуального мислення - Agent Swarm + PARL: динамічно оркестровані паралельні субагенти, до 4,5× нижча затримка, 78,4% на BrowseComp - MoonViT-3D: уніфікований енкодер зображення та відео з часовим стисненням 4×, що дозволяє 4× довші відео в одному контексті - Перемикач: ефективний токен RL, на 25–30% менше токенів без падіння точності Ось наша робота над масштабованою реальною агентною розвідкою. Більше деталей у звіті 👉