Apple apresenta AToken: Um tokenizador visual unificado • Primeiro tokenizador unificando imagens, vídeos e 3D • Espaço latente 4D compartilhado (preserva a reconstrução e a semântica) • Forte em tarefas de geração e compreensão (ImageNet 82,2%, MSRVTT 32,6%, 3D acc 90,9%)