أطلقت AI Lab Odyssey ومقرها لندن معاينة بحثية لنموذج يحول الفيديو إلى عوالم تفاعلية. في البداية ، مع التركيز على النماذج العالمية لإنتاج الأفلام والألعاب ، تعثر فريق Odyssey على وسيلة ترفيهية جديدة تمامًا.
يستجيب الفيديو التفاعلي الذي تم إنشاؤه بواسطة نموذج AI Odyssey للمدخلات في الوقت الفعلي. يمكنك التفاعل معها باستخدام لوحة المفاتيح أو الهاتف أو وحدة التحكم أو حتى الأوامر الصوتية في النهاية. يقوم الأشخاص في Odyssey بفواتيرها على أنها “نسخة مبكرة من Holodeck”.
يمكن لـ AI الأساسي إنشاء إطارات فيديو ذات مظهر واقعي كل 40 مللي ثانية. هذا يعني عندما تضغط على زر أو إجراء لفتة ، يستجيب الفيديو على الفور تقريبًا – مما يجعل الوهم بأنك تؤثر فعليًا على هذا العالم الرقمي.
“إن التجربة اليوم تبدو وكأنها استكشاف حلم رائع – لا يمكن استقراره ، ولكن جديد بلا شك” ، وفقًا لأوديسي. نحن لا نتحدث عن صور مصقولة جودة لعبة AAA هنا ، على الأقل ليس بعد.
ليس تقنية الفيديو القياسية الخاصة بك
دعنا نحصل على بعض التقنية للحظة. ما الذي يجعل تقنية الفيديو التفاعلية التي تم إنشاؤها من الذكاء الاصطناعي تختلف عن لعبة فيديو قياسية أو CGI ، على سبيل المثال ،؟ كل هذا يعود إلى شيء يطلق عليه أوديسي “نموذج العالم”.
على عكس نماذج الفيديو التقليدية التي تنشئ مقاطع كاملة في واحدة ، تعمل النماذج العالمية على حدة على حدة للتنبؤ بما يجب أن يأتي بعد ذلك بناءً على الحالة الحالية وأي مدخلات مستخدم. إنه يشبه مدى توقع نماذج اللغة الكلمة التالية في تسلسل ، ولكن أكثر تعقيدًا بلا حدود لأننا نتحدث عن إطارات الفيديو عالية الدقة بدلاً من الكلمات.
“نموذج العالم ، في جوهره ، نموذج ديناميكي مكيف العمل” ، كما يقول أوديسي. في كل مرة تتفاعل فيها ، يأخذ النموذج الحالة الحالية ، وإجراءاتك ، وتاريخ ما حدث ، ثم ينشئ إطار الفيديو التالي وفقًا لذلك.
والنتيجة هي شيء يشعر بأنه أكثر عضوية ولا يمكن التنبؤ بها من اللعبة التقليدية. لا يوجد منطق مبرمج مسبقًا يقول “إذا قام اللاعب بـ X ، فعندئذٍ يحدث”-في ذلك ، فإن الذكاء الاصطناعى يبذل قصارى جهده فيما يجب أن يحدث بعد ذلك بناءً على ما تعلمته من مشاهدة مقاطع فيديو لا حصر لها.
يعالج Odyssey التحديات التاريخية مع الفيديو الذي تم إنشاؤه من الذكاء الاصطناعى
بناء شيء مثل هذا ليس بالضبط نزهة في الحديقة. واحدة من أكبر العقبات مع الفيديو التفاعلي الذي تم إنشاؤه من الذكاء الاصطناعى هو إبقائها مستقرة مع مرور الوقت. عندما تقوم بإنشاء كل إطار استنادًا إلى الإطار السابق ، يمكن أن تتفاقم الأخطاء الصغيرة بسرعة (ظاهرة باحثو الذكاء الاصطناعي يطلقون على “الانجراف”.)
لمعالجة هذا ، استخدمت Odyssey ما يصفه “نموذج توزيع ضيق”-بشكل أساسي قبل تدريب الذكاء الاصطناعي على لقطات الفيديو العامة ، ثم صقله على مجموعة أصغر من البيئات. هذه المفاضلة تعني تنوعًا أقل ولكن الاستقرار الأفضل حتى لا يصبح كل شيء فوضى غريبة.
تقول الشركة إنها تحرز بالفعل “تقدمًا سريعًا” على نموذج الجيل التالي ، والذي يبدو أنه “مجموعة أكثر ثراءً من البكسلات والديناميات والإجراءات”.
إن تشغيل كل هذه التكنولوجيا الفاخرة في الوقت الفعلي ليست رخيصة. في الوقت الحالي ، تكلف البنية التحتية التي تعمل على تشغيل هذه التجربة ما بين 0.80-1.60 جنيه إسترليني (1-2) لكل ساعة مستخدم ، معتمدة على مجموعات من وحدات معالجة الرسومات H100 المنتشرة في جميع أنحاء الولايات المتحدة والاتحاد الأوروبي.
قد يبدو ذلك مكلفًا لبث الفيديو ، لكنه رخيص بشكل ملحوظ مقارنة بإنتاج محتوى اللعبة التقليدية أو الأفلام. ويتوقع Odyssey أن تتعثر هذه التكاليف أكثر عندما تصبح النماذج أكثر كفاءة.
فيديو تفاعلي: وسيلة سرد القصص التالية؟
على مر التاريخ ، أنجبت التقنيات الجديدة أشكالًا جديدة من سرد القصص – من اللوحات الكهفية إلى الكتب والتصوير الفوتوغرافي والراديو والأفلام وألعاب الفيديو. يعتقد Odyssey أن الفيديو التفاعلي الذي تم إنشاؤه بواسطة AI هو الخطوة التالية في هذا التطور.
إذا كانوا على حق ، فقد ننظر إلى النموذج الأولي لشيء سيحول الترفيه والتعليم والإعلان والمزيد. تخيل تدريب مقاطع الفيديو حيث يمكنك ممارسة المهارات التي يتم تدريسها ، أو تجارب السفر حيث يمكنك استكشاف الوجهات من الأريكة.
من الواضح أن معاينة البحث المتاحة الآن هي مجرد خطوة صغيرة نحو هذه الرؤية وأكثر من دليل على المفهوم أكثر من المنتج النهائي. ومع ذلك ، إنها لمحة مثيرة للاهتمام على ما قد يكون ممكنًا عندما تصبح العوالم التي تم إنشاؤها من الذكاء الاصطناعى ملاعبًا تفاعلية بدلاً من مجرد تجارب سلبية.
يمكنك تجريب المعاينة البحث هنا.
انظر أيضا: Telegram و Xai Forge Grok AI Deal
هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الكبيرة من قادة الصناعة؟ تحقق من AI و Big Data Expo الذي يقام في أمستردام ، كاليفورنيا ، ولندن. تم تحديد الحدث الشامل مع الأحداث الرائدة الأخرى بما في ذلك مؤتمر الأتمتة الذكي ، و blockx ، وأسبوع التحول الرقمي ، ومعرض Cyber Security & Cloud.
استكشاف أحداث وندوات الويب القادمة الأخرى التي تعمل بها TechForge هنا.