字節跳動正在🔥 在出色的SeeDream之後,他們(與清華大學合作)發佈了HuMo 17B和1.7B,這是以人為中心的多模態視頻模型(圖像、文本和音頻),採用Apache 2.0許可! 在開源視頻模型中似乎是最先進的,儘管長度最多為4秒 查看更多示例和鏈接🧵