We hebben dit model getraind om de economische eenheden van frame-ondertiteling, labeling en videozoekopdrachten om te draaien. Het verwerken van 1 miljard frames kostte voorheen miljoenen, maar is nu haalbaar voor teams die niet de grootste bedrijven zijn. We zien dit als een kans om petabyte+ schaal videobibliotheken te ontsluiten, die voorheen onmogelijk te doorzoeken, te categoriseren of clips uit te extraheren waren. We hebben dit model al op internetniveau ingezet in samenwerking met @grass. Als je een gebruiksgeval voor dit model hebt, stuur dan een DM. We bewegen extreem snel.
Inference
Inference15 aug, 02:02
Introducing ClipTagger-12b. A state-of-the-art video annotation model trained in collaboration with @grass. ClipTagger-12b delivers video annotation capabilities on par with Claude 4 and GPT-4.1 at 17x lower cost. Learn more:
7,14K