现在你可以让角色在@grok视频中说话。 老实说,我对执行速度感到印象深刻——很少有视频模型具备内置音频生成(更不用说需要同步嘴唇的语音了)。 用经典电影台词进行的初步测试 ⬇️
2.32K