機器人通常需要大量標記數據來學習精確的動作。 如果它們可以直接從人類視頻中學習控制技能……不需要標籤呢? 機器人預訓練剛剛取得了重大進展。 一種新的自迴歸機器人模型,從人類視頻數據中學習低級4D表示。 彌合視覺與現實世界機器人控制之間的差距。 這為什麼重要: ✅ 使用4D幾何進行預訓練可以更好地將人類視頻轉移到機器人動作 ✅ 克服高層次VLA預訓練與低層次機器人控制之間的差距 ✅ 解鎖更準確、數據高效的現實任務學習 有關更多細節,請查看論文: 📍 @Berkeley AI Research團隊將很快發佈項目頁面和代碼。