Apple giới thiệu AToken: Một bộ phân tách hình ảnh thống nhất • Bộ phân tách đầu tiên thống nhất hình ảnh, video & 3D • Không gian tiềm ẩn 4D chia sẻ (bảo tồn cả tái tạo & ngữ nghĩa) • Mạnh mẽ trong các nhiệm vụ sinh và hiểu (ImageNet 82.2%, MSRVTT 32.6%, độ chính xác 3D 90.9%)