Hoje, estamos lançando o FineVision, um enorme conjunto de dados de código aberto para treinar modelos de linguagem de visão de última geração: > 17,3 milhões de imagens > 24,3 milhões de amostras > 88,9 milhões de voltas > 9,5 bilhões de tokens de resposta Aqui estão minhas descobertas favoritas:
97,11K