Enfin, le modèle open source de vidéo pilotée par le son est arrivé ! Wan2.2-S2V, un modèle de 14 milliards de paramètres conçu spécifiquement pour l'animation corporelle pilotée par l'audio de niveau cinématographique. Dépassant la simple synchronisation labiale, il permet de piloter les mouvements des personnages avec le son ! Et en plus, il est open source ! Ce modèle est parfait pour les créateurs de contenu qui réalisent des histoires immersives en IA. C'est aussi le meilleur partenaire de ListenHub et FlowSpeech !
17,57K