Me impresionó genuinamente lo fácil que hace la búsqueda de videos. Creo que incrustar fotogramas completos con modelos multimodales no es el camino en este momento, y esta es la forma de hacerlo. ¡Esto podría cambiar en el futuro! La búsqueda de videos todavía es muy incipiente y definitivamente esto es una innovación.
Inference
Inference19 ago 2025
There's something really special about the schema that @grass developed for ClipTagger-12B. Once you start searching massive video datasets, using metadata filters for objects, production quality, logos, or actions becomes absolutely invaluable. The model we trained is great, but this was a real innovation that they came to us with.
2,38K