越来越多地与加密和机器人结合: - 机器人依赖视觉模型来解释和导航其环境。 - 它们在一个复杂的、多平面的、三维的世界中运作。 - 视觉模型需要独特的、真实世界的3D数据集,以实现物理运动和决策。 - 与可以在整个可抓取互联网中训练的LLM不同,目前没有可用的结构化“真实世界数据集”来启动新的视觉模型训练。 - 在这个领域对合成数据的高度依赖带来了显著的缺点。 - 人类创造的任务的“宇宙”实际上是无限的,涵盖了无数的工作流程、人类举止和需要在可训练数据集中捕捉的上下文细微差别。 - 即使真实世界数据被捕获,结构化和标记它仍然非常具有挑战性。 加密可以在整个流程中提供激励,从数据收集到标记,动员大规模的分布式人类贡献。
4.2K