ByteDance je zapnutý 🔥 Po vynikajícím SeeDream vydávají (s Tsinghua) HuMo 17B a 1.7B, modely videa zaměřené na člověka s multimodálními vstupy (obraz, text a zvuk) s Apache 2.0! Zdá se, že SOTA mezi OSS video modely, i když délka je až 4s Zobrazit další příklady a odkazy 🧵