volviéndose cada vez más cripto x robótica: - los robots dependen de modelos de visión para interpretar y navegar su entorno. - operan en un mundo complejo, multi-planar y tridimensional. - los modelos de visión requieren conjuntos de datos 3D únicos y del mundo real para permitir el movimiento físico y la toma de decisiones. - a diferencia de los llms que pueden ser entrenados con toda la internet extraíble, actualmente no hay un "conjunto de datos del mundo real" estructurado disponible para iniciar nuevos entrenamientos de modelos de visión. - la fuerte dependencia de datos sintéticos en este espacio conlleva desventajas significativas. - el "universo" de tareas creadas por humanos es efectivamente infinito, abarcando innumerables flujos de trabajo, mannerismos humanos y matices contextuales que deben ser capturados en conjuntos de datos entrenables. - incluso una vez que se captura datos del mundo real, estructurarlos y etiquetarlos sigue siendo altamente desafiante. la cripto puede proporcionar incentivos a lo largo de toda la cadena, desde la recolección de datos hasta la etiquetación, movilizando contribuciones humanas a gran escala y distribuidas.
4,24K