Os robôs geralmente precisam de toneladas de dados rotulados para aprender ações precisas. E se eles pudessem aprender habilidades de controle diretamente de vídeos humanos... Não são necessários rótulos? O pré-treinamento de robótica acabou de dar um GRANDE salto à frente. Um novo modelo robótico autorregressivo aprende representações 4D de baixo nível a partir de dados de vídeo humanos. Preenchendo a lacuna entre a visão e o controle robótico do mundo real. Por que isso importa: ✅ O pré-treinamento com geometria 4D permite uma melhor transferência do vídeo humano para as ações do robô ✅ Supera a lacuna entre o pré-treinamento VLA de alto nível e o controle robótico de baixo nível ✅ Desbloqueia um aprendizado mais preciso e eficiente em termos de dados para tarefas do mundo real Para mais detalhes, confira o artigo: 📍 A equipe da @Berkeley AI Research lançará a página e o código do projeto em breve.