ByteDance on päällä 🔥 Erinomaisen SeeDreamin jälkeen he (Tsinghuan kanssa) julkaisevat HuMo 17B:n ja 1.7B:n, ihmiskeskeiset videomallit, joissa on multimodaaliset tulot (kuva, teksti ja ääni) Apache 2.0:lla! Näyttää SOTA:lta OSS-videomallien joukossa, vaikka pituus on jopa 4 sekuntia Katso lisää esimerkkejä ja linkkejä 🧵