🚨 DeepMind hat endlich das Veo3-Papier veröffentlicht, das zeigt, was wir alle beim Spielen mit Video-Gen-Modellen erkennen. Genau wie bei LLMs ist visuelles Denken eine emergente Eigenschaft des Trainings mit Unmengen von Videos. Es kann Aufgaben lösen, die nicht explizit in den Trainingsdaten enthalten sind. "Veo 3 ist der GPT-3-Moment für visuelles Denken"
Quelle:
114,64K