كشفت Google النقاب عن نموذجها “الأكثر قدرة” لفيديو الذكاء الاصطناعي التوليدي في مؤتمر Google I/O 2024، وقد تجاوز هذا النموذج بعض العينات المنتقاة بعناية. تعمل جوجل مع دونالد جلوفر، المعروف أيضًا باسم تشايلدش جامبينو، لإنشاء فيلم قصير يستفيد من نموذج الذكاء الاصطناعي الجديد من جوجل، والذي يطلق عليه اسم Veo.
التفاصيل حول Veo خفيفة في الوقت الحالي، لكن جوجل تقول إنها قادرة على تحويل رسالة نصية إلى فيديو، على غرار Sora من OpenAI. وتختبر جوجل النموذج حاليًا مع مجموعة مختارة من المبدعين، لكنها تقول إنها تخطط لطرح Veo لإصدار أوسع قريبًا. يمكنك الاشتراك في قائمة الانتظار على labs.google.com.
قال جلوفر في مقطع فيديو قصير يعرض بعض اللحظات من وراء الكواليس من المشروع الذي لم يذكر اسمه: “سيصبح الجميع مخرجًا، ويجب أن يصبح الجميع مخرجًا”. المشروع عبارة عن تعاون بين Glover وGoogle DeepMind، وتقول الشركة إنه “قريبًا”. يمكنك مشاهدة مقطع الفيديو، بالإضافة إلى عدة أمثلة للفيديو الذي تم إنشاؤه أدناه.
لقد وضعنا نموذجنا المتطور لتوليد الفيديو Veo في أيدي صانعي الأفلام @دونالد جلوفر واستوديوه الإبداعي جيلجا.
لنلقي نظرة. ↓ #GoogleIO pic.twitter.com/oNLDq1YlHC
— جوجل ديب مايند (@GoogleDeepMind) 14 مايو 2024
تقول Google إن هذه المقاطع هي “مخرجات أولية غير محررة” لـ Veo، وجميع المقاطع تبدو مثيرة للإعجاب للغاية. بدلاً من مجرد إنشاء مقطع فيديو بموضوعاتك المحددة، تقول Google إن Veo قادر على التقاط الفروق الدقيقة مثل تقنيات الكاميرا والمؤثرات المرئية التي قد تريدها في لقطتك. وهذا، وفقًا لجوجل، يسمح لك بتكرار الأفكار بسرعة للاقتراب من اللقطة النهائية التي تريدها.
يبدو كل هذا جيدًا إلى حد يصعب تصديقه، لكن الذكاء الاصطناعي التوليدي للفيديو تطور بسرعة خلال الأشهر القليلة الماضية. قبل شهرين فقط، عرض OpenAI العديد من مقاطع الفيديو التي تم إنشاؤها باستخدام Sora والتي بدت وكأنها تم التقاطها بكاميرا. وتشير التقارير إلى أن شركة OpenAI تقوم بشراء Sora في هوليوود، وتعمل مع الاستوديوهات لإضافة أداة الذكاء الاصطناعي التوليدية الخاصة بها إلى الأفلام. لقد رأينا أيضًا إضافة تحويل النص إلى فيديو إلى Adobe Premiere Pro، والذي يجلب الذكاء الاصطناعي التوليدي إلى إحدى أدوات تحرير الفيديو الأكثر استخدامًا.
على الرغم من أن Veo مثير، إلا أنه من المهم إبقاء أداة الذكاء الاصطناعي مرتكزة على الواقع. كانت شركات مثل OpenAI محدودة للغاية فيما يتعلق بالذكاء الاصطناعي التوليدي للفيديو، ويبدو أن جوجل تتخذ نهجًا مماثلاً. هناك سبب وجيه لذلك، حيث أن فيديو الذكاء الاصطناعي الواقعي في الأيدي الخطأ يمكن أن يسبب الكثير من المشاكل. نأمل أن تعمل Google على حل مكامن الخلل في Veo قبل طرحها لعامة الناس. وإلا فقد يكون لدينا تكرار لجنون Bing Chat بين أيدينا.