🚨 DeepMind akhirnya menjatuhkan makalah Veo3 yang menunjukkan apa yang kita semua sadari dari bermain dengan model video-gen. Sama seperti LLM, penalaran visual adalah properti yang muncul dari pelatihan pada banyak video. Ini dapat menyelesaikan tugas yang tidak secara eksplisit dalam data pelatihan. "Veo 3 adalah momen GPT-3 untuk penalaran visual"
Sumber:
236,09K