ロボットは通常、正確な動作を学習するために大量のラベル付きデータを必要とします。 人間の映像から直接コントロールスキルを学べたらどうなるでしょうか...ラベルは必要ありませんか? ロボット工学の事前トレーニングは、大きく前進しました。 新しい自己回帰ロボットモデルは、人間のビデオデータから低レベルの4D表現を学習します。 ビジョンと現実世界のロボット制御の間のギャップを埋めます。 なぜこれが重要なのか: ✅ 4Dジオメトリによる事前トレーニングにより、人間のビデオからロボットのアクションへのより良い転送が可能になります ✅ 高レベルのVLA事前トレーニングと低レベルのロボット制御の間のギャップを克服します ✅ 実際のタスクに対して、より正確でデータ効率の高い学習を実現します 詳細については、論文をご覧ください。 📍 @Berkeley AI Research のチームは、プロジェクト ページとコードを間もなくリリースする予定です。