For noen dager siden børstet jeg en video "Mirror Dream Edge", det er lyd og bilde, konsistensen av lyd og bilde er veldig bra, og nå er bildegenereringsvideoen relativt moden, men lyden og bildet er integrert, og det er ikke lett å nøyaktig justere munnformen, uttrykket og stemmen. Senere lærte jeg at denne videoen er fullstendig generert av Baidus dampmaskinvideomodell, som kan støtte generering av stemmer veldig godt, spesielt kinesisk tale.
10,79K