Apple présente AToken : un tokenizeur visuel unifié • Premier tokenizeur unifiant images, vidéos et 3D • Espace latent 4D partagé (préserve à la fois la reconstruction et la sémantique) • Performances solides sur les tâches de génération et de compréhension (ImageNet 82,2 %, MSRVTT 32,6 %, précision 3D 90,9 %)