جوجل تكشف عن نموذج ذكاء اصطناعي يحول الصور إلى فيديو

كشفت الباحثون في جوجل عن نظام ذكاء اصطناعي جديد يتيح تحويل الصور الثابتة إلى مقاطع فيديو متحركة، ويُطلق على ذلك النموذج اسم “فلوجر” VLOGGER.

ووفقًا لما ذكره باحثو جوجل فإن ذلك النموذج يمكنه توليد مقاطع فيديو واقعية لأشخاص يتحدثون ويتحركون ويظهرون التعبيرات الجسدية والإيماءات من صورة ثابتة واحدة.

وتعتمد تلك التقنية على نماذج تعلم الآلة المتقدمة لإنتاج كثير من اللقطات الواقعية وتجميعها معًا في مقطع فيديو.

وتفتح تلك التقنية الباب لعدد كبير من التطبيقات المحتملة لها، لكنها في الوقت نفسه تثير المخاوف بشأن إساءة استخدامها للتضليل وإنتاج مقاطع فيديو على نحو يشبه آليات التزييف العميق.

ووفقًا للورقة البحثية التي نشرها الباحثون في قطاع جوجل للأبحاث، يمكن لنموذج الذكاء الاصطناعي الجديد الاعتماد على مدخلات تتضمن صورة لشخص ما مع مقطع صوتي لإنتاج مقطع فيديو يُظهر الشخص وهو يتحدث بالصوت نفسه مع تعبيرات الوجه وإيماءات الرأس واليد الملائمة.

ومع أن مقاطع الفيديو التي نشرها باحثو جوجل ليست مثالية وبها بعض الأخطاء، وقصيرة نسبيًا ولها خلفية ثابتة، ولا يتحرك الأفراد فيها في بيئة ثلاثية الأبعاد، لكنها تمثل طفرة كبيرة في تحريك الصور الثابتة.

واعتمد الباحثون على نوع جديد من نماذج الذكاء الاصطناعي تُسمى نماذج الانتشار Diffusion Models، التي أظهرت أداءً مميزًا في توليد الصور من النصوص، وقد وسع فريق الباحثين استخدامها ليشمل توليد مقاطع الفيديو مع التدريب على مجموعة ضخمة من البيانات، شملت ما يزيد على 800 ألف هوية مختلفة و 2200 ساعة من مقاطع الفيديو، مما أتاح لنموذج VLOGGER تعلم إنشاء مقاطع فيديو لأشخاص من أعراق وأعمار وملابس وأوضاع وبيئات متنوعة دون تحيز.

ويمكن استخدام نموذج VLOGGER في العديد من الاستخدامات، ومنها دبلجة مقاطع الفيديو تلقائيًا عبر تبديل المسار الصوتي، وملء الإطارات المفقودة في مقاطع الفيديو، وإنشاء صور رمزية واقعية للألعاب والواقع الافتراضي، وإنشاء ربوتوتات دردشة يمكنها التفاعل مع المستخدمين على نحو أفضل. ومع ذلك، فإن احتمالية إساءة استخدام النموذج ما تزال قائمة.

تم نسخ الرابط

مقالات قد تهمك

يتيح وضع الذكاء الاصطناعي في بحث جوجل الآن طلب المتابعة عبر (AI Overviews).

جوجل تطرح Nano Banana 2 بسرعة أكبر من ذي قبل.

من المتوقع أن تكشف آبل في 4 مارس عن أجهزة iPhone وiPad وMacBook جديدة.

كاسبرسكي تطلق KATA 8.0 لتعزيز قدرات رصد الشبكات والاستجابة للهجمات

شركة الصبوح: شريك موثوق لقطاع مواد البناء والتجهيزات الصحية في الإمارات

أفضل 10 ألعاب للأطفال التي تعزز التعلم والإبداع

سناب: مستخدمون يخططون لرمضان 2026 مبكرًا وزخم الشراء يتسارع في الإمارات والسعودية

برمجية تجسس جديدة تهدد آيفون وأندرويد

آبل تستعد لإطلاق آيفون جديد في الذكرى الخمسين

إطلاق موقع “سحابة”: كمنصة متكاملة لخدمات الدومينات والاستضافة في السعودية والعالم

منصات التداول الحلال: تجربة واستعراض لأبرز الخيارات

من الاستجابة إلى الاستباق.. كيف تعيد سوريَة بناء سجل المخاطر الوطني بالبيانات؟

مقارنة بين Samsung Galaxy Z Fold 6 و Galaxy S24 Ultra: لا تخطئ

سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

يحصل iPhone على أول تطبيق إباحي أصلي له

كل ما تريد معرفته عن Reacher الموسم الثالث

Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

استخدم chatgpt بالعربي مجانا بدون تسجيل

أفضل مزودي خدمة الإنترنت المنزلي لعام 2024

شات جي بي تي بدون تسجيل.. ChatGPT مجانا بالعربي

رائج الآن