Acum câteva zile, am periat un videoclip "Mirror Dream Edge", există sunet și imagine, consistența sunetului și a imaginii este foarte bună, iar acum videoclipul de generare a imaginii este relativ matur, dar sunetul și imaginea sunt integrate și nu este ușor să aliniați cu precizie forma gurii, expresia și vocea. Mai târziu, am aflat că acest videoclip este complet generat de modelul video al motorului cu aburi al Baidu, care poate susține foarte bine generarea vocilor, în special a vorbirii chinezești.
15,89K