🚨 DeepMind ha finalmente pubblicato il documento Veo3 che mostra ciò che tutti noi realizziamo giocando con i modelli di generazione video. Proprio come gli LLM, il ragionamento visivo è una proprietà emergente dell'addestramento su tonnellate di video. Può risolvere compiti non esplicitamente presenti nei dati di addestramento. "Veo 3 è il momento GPT-3 per il ragionamento visivo"
Fonte:
285,31K