Os robôs geralmente precisam de toneladas de dados rotulados para aprender ações precisas. E se eles pudessem aprender habilidades de controle diretamente de vídeos humanos... sem necessidade de rótulos? O pré-treinamento em robótica deu um GRANDE salto em frente. Um novo Modelo Robótico Autoregressivo aprende representações 4D de baixo nível a partir de dados de vídeo humano. Conectando a lacuna entre visão e controle robótico no mundo real. Por que isso é importante: ✅ O pré-treinamento com geometria 4D permite uma melhor transferência de vídeo humano para ações robóticas ✅ Supera a lacuna entre o pré-treinamento VLA de alto nível e o controle robótico de baixo nível ✅ Desbloqueia um aprendizado mais preciso e eficiente em dados para tarefas do mundo real Para mais detalhes, confira o artigo: 📍 A equipe da @Berkeley AI Research lançará em breve a página do projeto e o código.