Aujourd'hui, nous lançons FineVision, un énorme ensemble de données open-source pour entraîner des modèles de vision-langage à la pointe de la technologie : > 17,3 millions d'images > 24,3 millions d'échantillons > 88,9 millions de tours > 9,5 milliards de tokens de réponse Voici mes découvertes préférées :
97,11K