@karpathy vừa xem lại cuộc phỏng vấn của mình, @lexfridman có làm gì đó với ánh sáng không?
Andrej Karpathy
Andrej Karpathy18 thg 7, 2025
Mô hình video khuếch tán nhưng bây giờ - **thời gian thực**! Các bộ lọc video đơn giản là thời gian thực nhưng chỉ có thể thực hiện tô màu và kiểu cơ bản. Các mô hình khuếch tán video (Veo và bạn bè) là điều kỳ diệu, nhưng chúng mất nhiều giây / phút để tạo. MirageLSD là phép thuật thời gian thực. Không giống như các bộ lọc video đơn giản, các mô hình khuếch tán thực sự * hiểu * những gì chúng đang xem, vì vậy chúng có thể tạo kiểu cho tất cả các phần của nguồn cấp dữ liệu một cách thông minh (ví dụ: đội mũ lên đầu hoặc kiếm ánh sáng vào tay, v.v.). Và chúng có thể điều khiển tùy tiện, ví dụ như bằng lời nhắc văn bản. Bộ lọc video thông minh, có thể tùy chỉnh mở khóa nhiều ý tưởng thú vị theo thời gian: - Chuyển đổi nguồn cấp dữ liệu máy ảnh thành thực tế thay thế - Chỉ đạo và quay phim của riêng bạn, diễn xuất các cảnh bằng đạo cụ. Thời gian thực => phản hồi / đánh giá tức thì. - Trò chơi mã rung cảm chỉ xung quanh các quả cầu / khối đơn giản, sau đó sử dụng mô hình khuếch tán thời gian thực để kết cấu trò chơi của bạn để làm cho nó đẹp mắt. - Tạo kiểu và tùy chỉnh bất kỳ nguồn cấp dữ liệu video nào: trò chơi, video,... ví dụ: Skyrim nhưng "SỬ THI HƠN"? DOOM II nhưng chất lượng Unreal Engine hiện đại chỉ với một lời nhắc? Phim kinh dị nhưng "dễ thương, hồng và thỏ thôi"? Tôi không biết! - Hình nền cuộc gọi thu phóng +++ - thử quần áo theo thời gian thực ảo - Kính: Ví dụ: hoạt hình hóa tầm nhìn của bạn trong thời gian thực? - bây giờ chúng ta có thể xây dựng Harry Potter Mirror of Erised, hiển thị "nguồn cấp dữ liệu thô" của bạn trong gương nhưng được tăng cường với những mong muốn sâu sắc nhất của bạn (như AI suy ra). - Tôi không biết, có lẽ tôi đang bỏ lỡ cái lớn nhất, rất nhiều thứ! (Tiết lộ Tôi là nhà đầu tư thiên thần (rất nhỏ) trong Decart, tôi rất vui vì imo công nghệ này sẽ trở nên rất tốt rất nhanh và nó mang lại cảm giác chung chung, mạnh mẽ nhưng nó cũng rất khó về mặt kỹ thuật. Xin chúc mừng sự ra mắt của nhóm!)
6,35K