diventando sempre più "crypto x robotics pilled": - i robot si basano su modelli visivi per interpretare e navigare nel loro ambiente. - operano in un mondo complesso, multi-planare e tridimensionale. - i modelli visivi richiedono set di dati 3D unici e reali per abilitare il movimento fisico e il processo decisionale. - a differenza dei llms che possono essere addestrati su tutto l'internet estraibile, attualmente non esiste un "set di dati del mondo reale" strutturato disponibile per avviare nuovi addestramenti di modelli visivi. - la forte dipendenza dai dati sintetici in questo campo comporta svantaggi significativi. - l'"universo" dei compiti creati dall'uomo è effettivamente infinito, comprendendo innumerevoli flussi di lavoro, maniere umane e sfumature contestuali che devono essere catturate in set di dati addestrabili. - anche una volta catturati i dati del mondo reale, strutturarli e etichettarli rimane altamente impegnativo. la crypto può fornire incentivi lungo l'intero stack, dalla raccolta dei dati all'etichettatura, mobilitando un contributo umano distribuito su larga scala.
4,2K