🚨 DeepMind cuối cùng đã phát hành tài liệu Veo3, cho thấy những gì chúng ta đều nhận ra từ việc chơi với các mô hình video-gen. Giống như LLMs, lý luận hình ảnh là một thuộc tính nổi bật của việc đào tạo trên hàng tấn video. Nó có thể giải quyết các nhiệm vụ không được rõ ràng trong dữ liệu đào tạo. "Veo 3 là khoảnh khắc GPT-3 cho lý luận hình ảnh"
Nguồn:
285,3K