Microsoft har precis släppt VibeVoice - 1.5B SoTA text-till-tal-modell - MIT-licensierad 🔥 > Den kan generera upp till 90 minuters ljud > Stöder samtidig generering av > 4 högtalare > Streaming och större 7B-modell på gång > Kan göra tvärspråklig och sjungande syntes Älskar uttrycksfullheten och känslokontrollen på modellen! Kudos till Microsoft 🤗
124,84K