🚨 DeepMind a renunțat în cele din urmă la lucrarea Veo3 care arată ce ne dăm seama cu toții jucându-ne cu modelele video-gen. La fel ca LLM-urile, raționamentul vizual este o proprietate emergentă a antrenamentului pe tone de videoclipuri. Poate rezolva sarcini care nu sunt explicite în datele de antrenament. "Veo 3 este momentul GPT-3 pentru raționamentul vizual"
Sursă:
285,31K