Byl jsem opravdu ohromen tím, jak snadné je vyhledávání videa. Myslím, že vkládání plných snímků do multimodálních modelů není v tuto chvíli řešením, a toto je cesta. To se však může v budoucnu změnit! Vyhledávání videí je stále velmi v plenkách a toto je rozhodně inovace
Inference
Inference19. 8. 07:28
Na schématu, které @grass vyvinuto pro ClipTagger-12B, je něco opravdu zvláštního. Jakmile začnete prohledávat masivní video datové sady, používání metadatových filtrů pro objekty, kvalitu produkce, loga nebo akce se stane naprosto neocenitelným. Model, který jsme natrénovali, je skvělý, ale tohle byla skutečná inovace, se kterou za námi přišli.
2,36K