Před několika dny jsem vykartáčoval video "Mirror Dream Edge", je tam zvuk a obraz, konzistence zvuku a obrazu je velmi dobrá a nyní je video pro generování obrazu relativně vyspělé, ale zvuk a obraz jsou integrovány a není snadné přesně zarovnat tvar, výraz a hlas úst. Později jsem se dozvěděl, že toto video je kompletně generováno modelem videa s parním strojem Baidu, který může velmi dobře podporovat generování hlasů, zejména čínské řeči.
10,79K