越來越多地與加密和機器人結合: - 機器人依賴視覺模型來解釋和導航其環境。 - 它們在一個複雜的、多平面的、三維的世界中運作。 - 視覺模型需要獨特的、真實世界的3D數據集,以實現物理運動和決策。 - 與可以在整個可抓取互聯網中訓練的LLM不同,目前沒有可用的結構化“真實世界數據集”來啟動新的視覺模型訓練。 - 在這個領域對合成數據的高度依賴帶來了顯著的缺點。 - 人類創造的任務的“宇宙”實際上是無限的,涵蓋了無數的工作流程、人類舉止和需要在可訓練數據集中捕捉的上下文細微差別。 - 即使真實世界數據被捕獲,結構化和標記它仍然非常具有挑戰性。 加密可以在整個流程中提供激勵,從數據收集到標記,動員大規模的分佈式人類貢獻。
4.2K