🚨 A DeepMind finalmente lançou o artigo Veo3, que mostra o que todos nós percebemos ao brincar com modelos de geração de vídeo. Assim como os LLMs, o raciocínio visual é uma propriedade emergente do treinamento em toneladas de vídeo. Ele pode resolver tarefas não explicitamente nos dados de treinamento. "Veo 3 é o momento GPT-3 para o raciocínio visual"
Fonte:
186,82K