Apple presenteert AToken: Een verenigde visuele tokenizer • Eerste tokenizer die afbeeldingen, video's en 3D verenigt • Gedeelde 4D latente ruimte (behoudt zowel reconstructie als semantiek) • Sterk in generatieve en begripstaken (ImageNet 82,2%, MSRVTT 32,6%, 3D acc 90,9%)