قبل بضعة أيام ، قمت بتنظيف مقطع فيديو "Mirror Dream Edge" ، وهناك صوت وصورة ، واتساق الصوت والصورة جيد جدا ، والآن أصبح فيديو إنشاء الصورة ناضجا نسبيا ، ولكن الصوت والصورة متكاملان ، وليس من السهل محاذاة شكل الفم والتعبير والصوت بدقة. في وقت لاحق ، علمت أن هذا الفيديو تم إنشاؤه بالكامل بواسطة نموذج فيديو المحرك البخاري من Baidu ، والذي يمكن أن يدعم توليد الأصوات بشكل جيد للغاية ، وخاصة الكلام الصيني.
‏‎9.54‏K