Роботам зазвичай потрібні тонни мічених даних, щоб навчитися точним діям. А що, якби вони могли навчитися навичкам керування безпосередньо з відео на людях... Етикетки не потрібні? Попередня підготовка з робототехніки просто зробила ВЕЛИКИЙ стрибок уперед. Нова авторегресійна роботизована модель навчається низькорівневим 4D-представленням на основі відеоданих людини. Подолання розриву між зором і реальним роботизованим керуванням. Чому це важливо: ✅ Попереднє тренування з 4D-геометрією дозволяє краще переходити від відео людини до дій робота ✅ Долає розрив між високорівневою попередньою підготовкою VLA та низькорівневим роботизованим керуванням ✅ Забезпечує більш точне та ефективне навчання для виконання реальних завдань Для отримання більш детальної інформації ознайомтеся з документом: 📍 Команда @Berkeley AI Research незабаром випустить сторінку проєкту та код.