Tornando-se cada vez mais cripto x robótica pilled: - Os robôs dependem de modelos de visão para interpretar e navegar em seu ambiente. - eles operam em um mundo complexo, multiplanar e tridimensional. - Os modelos de visão exigem conjuntos de dados 3D exclusivos e reais para permitir o movimento físico e a tomada de decisões. - Ao contrário dos LLMs que podem ser treinados em toda a Internet raspável, atualmente não há um "conjunto de dados do mundo real" estruturado disponível para inicializar as execuções de treinamento do modelo Novel Vision. - A forte dependência de dados sintéticos neste espaço traz desvantagens significativas. - O "universo" de tarefas criadas por humanos é efetivamente infinito, abrangendo inúmeros fluxos de trabalho, maneirismos humanos e nuances contextuais que precisam ser capturadas em conjuntos de dados treináveis. - Mesmo depois que os dados do mundo real são capturados, estruturá-los e rotulá-los continua sendo altamente desafiador. A criptomoeda pode fornecer incentivos em toda a pilha, desde a coleta de dados até a rotulagem, mobilizando a contribuição humana distribuída em larga escala.
4,25K