ByteDance este activat 🔥 După excelentul SeeDream, ei (împreună cu Tsinghua) lansează HuMo 17B și 1.7B, modele video centrate pe om cu intrări multimodale (imagine, text și audio) cu Apache 2.0! Pare SOTA printre modelele video OSS, deși lungimea este de până la 4 secunde Vezi mai multe exemple și link-uri 🧵