轰!微软刚刚发布了升级版的 VibeVoice Large ~10B 文本转语音模型 - MIT 许可 🔥 > 几分钟内生成多语者播客 ⚡ > 在 ZeroGPU 上使用 H200(免费)运行速度极快 今天就来试试吧!
Vaibhav (VB) Srivastav
Vaibhav (VB) Srivastav2025年8月26日
微软刚刚发布了 VibeVoice - 1.5B SoTA 文本转语音模型 - MIT 许可 🔥 > 它可以生成长达 90 分钟的音频 > 支持同时生成超过 4 个说话者 > 正在推出流媒体和更大的 7B 模型 > 能够进行跨语言和歌唱合成 我喜欢这个模型的表现力和情感控制!向微软致敬 🤗
82.48K