تقدم Apple AToken: توكنازر مرئي موحد • أول رمز يوحد الصور ومقاطع الفيديو و 3D • مساحة كامنة مشتركة 4D (تحافظ على كل من إعادة الإعمار والدلالات) • قوي عبر الجنرال وفهم المهام (ImageNet 82.2٪ ، MSRVTT 32.6٪ ، 3D acc 90.9٪)