🚨 Apple ha appena rilasciato FastVLM su Hugging Face - VLM in tempo reale da 0.5, 1.5 e 7B con supporto WebGPU 🤯
> 85 volte più veloce e 3.4 volte più piccolo rispetto a VLM di dimensioni comparabili
> 7.9 volte più veloce TTFT per modelli più grandi
> progettato per produrre meno token di output e ridurre il tempo di codifica per immagini ad alta risoluzione
Bonus: funziona in TEMPO REALE direttamente nel tuo browser alimentato da transformers.js e WebGPU 🔥
Provalo nella demo qui sotto 👇
🚨 Apple ha appena rilasciato FastVLM su Hugging Face - VLM in tempo reale da 0.5, 1.5 e 7B con supporto WebGPU 🤯
> 85 volte più veloce e 3.4 volte più piccolo rispetto a VLM di dimensioni comparabili
> 7.9 volte più veloce TTFT per modelli più grandi
> progettato per produrre meno token di output e ridurre il tempo di codifica per immagini ad alta risoluzione
Bonus: funziona in TEMPO REALE direttamente nel tuo browser alimentato da transformers.js e WebGPU 🔥
Provalo nella demo qui sotto 👇
NUOVO: Apple rilascia FastVLM e MobileCLIP2 su Hugging Face! 🤗
I modelli sono fino a 85 volte più veloci e 3,4 volte più piccoli rispetto ai lavori precedenti, consentendo applicazioni VLM in tempo reale! 🤯
Può persino fare il captioning video dal vivo 100% localmente nel tuo browser (zero installazione). Fantastico per l'accessibilità!