终于,声音驱动视频的开源模型来了! Wan2.2-S2V,一个专为电影级音频驱动人体动画设计的 14B 参数模型。 超越普通的对口型,用声音驱动角色动作! 而且它还是开源的! 这个模型非常内容创作者制作沉浸式 AI 故事。 也是 ListenHub 和 FlowSpeech 的最佳搭档!
12.16K