devenir de plus en plus axé sur la crypto et la robotique : - les robots s'appuient sur des modèles de vision pour interpréter et naviguer dans leur environnement. - ils opèrent dans un monde complexe, multi-planaire et tridimensionnel. - les modèles de vision nécessitent des ensembles de données 3D uniques et réels pour permettre le mouvement physique et la prise de décision. - contrairement aux LLM qui peuvent être formés sur l'ensemble de l'internet récupérable, il n'existe actuellement aucun "ensemble de données du monde réel" structuré disponible pour initier de nouvelles sessions d'entraînement de modèles de vision. - une forte dépendance aux données synthétiques dans ce domaine présente des inconvénients significatifs. - l'"univers" des tâches créées par l'homme est effectivement infini, englobant d'innombrables flux de travail, manières humaines et nuances contextuelles qui doivent être capturées dans des ensembles de données entraînables. - même une fois que les données du monde réel sont capturées, leur structuration et leur étiquetage restent très difficiles. la crypto peut fournir des incitations à travers toute la chaîne, de la collecte de données à l'étiquetage, mobilisant une contribution humaine à grande échelle et distribuée.
4,21K