Hoy, estamos lanzando FineVision, un enorme conjunto de datos de código abierto para entrenar modelos de lenguaje de visión de última generación: > 17,3 millones de imágenes > 24,3 millones de muestras > 88,9 millones de vueltas > 9.5B tokens de respuesta Aquí están mis hallazgos favoritos:
97.1K