Oggi stiamo rilasciando FineVision, un enorme dataset open-source per l'addestramento di modelli Vision-Language all'avanguardia: > 17,3M immagini > 24,3M campioni > 88,9M turni > 9,5B token di risposta Ecco le mie scoperte preferite:
97,07K