Los robots generalmente necesitan toneladas de datos etiquetados para aprender acciones precisas. ¿Qué pasaría si pudieran aprender habilidades de control directamente de videos humanos ... ¿No se necesitan etiquetas? El preentrenamiento de robótica acaba de dar un GRAN salto hacia adelante. Un nuevo modelo robótico autorregresivo aprende representaciones 4D de bajo nivel a partir de datos de video humanos. Cerrando la brecha entre la visión y el control robótico del mundo real. Por qué esto es importante: ✅ El preentrenamiento con geometría 4D permite una mejor transferencia del video humano a las acciones del robot ✅ Supera la brecha entre el preentrenamiento de VLA de alto nivel y el control robótico de bajo nivel ✅ Desbloquea un aprendizaje más preciso y eficiente en cuanto a datos para tareas del mundo real Para obtener más detalles, consulte el documento: 📍 El equipo de @Berkeley AI Research publicará pronto la página y el código del proyecto.