🚨 أخيرا ، أسقطت DeepMind ورقة Veo3 التي تظهر ما ندركه جميعا من اللعب مع نماذج جيل الفيديو. تماما مثل LLMs ، يعد التفكير البصري خاصية ناشئة للتدريب على الكثير من الفيديو. يمكنه حل المهام غير الصريحة في بيانات التدريب. "Veo 3 هي لحظة GPT-3 للتفكير البصري"
مصدر:
‏‎153.66‏K