🚨 DeepMind наконец-то выпустила статью о Veo3, которая показывает то, что мы все понимаем, играя с моделями видео-генерации. Как и LLM, визуальное рассуждение является возникающим свойством обучения на огромном количестве видео. Оно может решать задачи, которые не были явно включены в обучающие данные. "Veo 3 — это момент GPT-3 для визуального рассуждения"
Источник:
332,72K