ByteDance đang trên 🔥 Sau thành công của SeeDream, họ (cùng với Tsinghua) phát hành HuMo 17B và 1.7B, các mô hình video tập trung vào con người với đầu vào đa phương thức (Hình ảnh, Văn bản và Âm thanh) với Apache 2.0! Có vẻ như là SOTA trong số các mô hình video OSS, mặc dù độ dài lên đến 4 giây Xem thêm ví dụ & liên kết 🧵