Hoje, estamos a lançar o FineVision, um enorme conjunto de dados de código aberto para treinar Modelos de Visão-Linguagem de última geração: > 17,3M imagens > 24,3M amostras > 88,9M turnos > 9,5B tokens de resposta Aqui estão as minhas descobertas favoritas:
97,11K