Apple представляет AToken: унифицированный визуальный токенизатор • Первый токенизатор, объединяющий изображения, видео и 3D • Общая 4D латентная пространство (сохраняет как реконструкцию, так и семантику) • Высокая эффективность в задачах генерации и понимания (ImageNet 82.2%, MSRVTT 32.6%, 3D точность 90.9%)