机器人通常需要大量标记数据来学习精确的动作。 如果它们可以直接从人类视频中学习控制技能……不需要标签呢? 机器人预训练刚刚取得了重大进展。 一种新的自回归机器人模型,从人类视频数据中学习低级4D表示。 弥合视觉与现实世界机器人控制之间的差距。 这为什么重要: ✅ 使用4D几何进行预训练可以更好地将人类视频转移到机器人动作 ✅ 克服高层次VLA预训练与低层次机器人控制之间的差距 ✅ 解锁更准确、数据高效的现实任务学习 有关更多细节,请查看论文: 📍 @Berkeley AI Research团队将很快发布项目页面和代码。