Roboti obvykle potřebují spoustu označených dat, aby se naučili přesné akce. Co kdyby se mohli naučit ovládat přímo z lidských videí... Nejsou potřeba žádné štítky? Předškolení robotiky udělalo VELKÝ skok vpřed. Nový autoregresní robotický model se učí nízkoúrovňové 4D reprezentace z lidských video dat. Překlenutí propasti mezi viděním a robotickým řízením v reálném světě. Proč je to důležité: ✅ Předtrénování pomocí 4D geometrie umožňuje lepší přenos z lidského videa na akce robota ✅ Překonává mezeru mezi předběžným školením VLA na vysoké úrovni a robotickým řízením na nízké úrovni ✅ Odemyká přesnější a datově efektivnější učení pro úkoly v reálném světě Pro více podrobností se podívejte na článek: 📍 Tým společnosti @Berkeley AI Research brzy zveřejní stránku a kód projektu.