🚨 DeepMind släppte äntligen Veo3-artikeln som visar vad vi alla inser när vi leker med videogenmodeller. Precis som LLM:er är visuellt resonemang en framväxande egenskap hos träning på massor av video. Den kan lösa uppgifter som inte uttryckligen finns i träningsdata. "Veo 3 är GPT-3-ögonblicket för visuellt resonemang"
Källa:
285,31K