字节跳动正在🔥 在出色的SeeDream之后,他们(与清华大学合作)发布了HuMo 17B和1.7B,这是以人为中心的多模态视频模型(图像、文本和音频),采用Apache 2.0许可! 在开源视频模型中似乎是最先进的,尽管长度最多为4秒 查看更多示例和链接🧵