🚨 DeepMind konečně vypustil článek Veo3, který ukazuje, co si všichni uvědomujeme při hraní si s video-gen modely. Stejně jako u LLM je vizuální uvažování emergentní vlastností tréninku na tunách videa. Dokáže řešit úkoly, které nejsou explicitně obsaženy v trénovacích datech. "Veo 3 je okamžik GPT-3 pro vizuální uvažování"
Zdroj:
285,3K