För några dagar sedan borstade jag en video "Mirror Dream Edge", det finns ljud och bild, konsistensen på ljud och bild är mycket bra, och nu är bildgenereringsvideon relativt mogen, men ljud och bild är integrerade, och det är inte lätt att exakt justera munformen, uttrycket och rösten. Senare fick jag veta att den här videon är helt genererad av Baidus ångmaskinsvideomodell, som kan stödja genereringen av röster mycket bra, särskilt kinesiskt tal.
15,89K