من الواضح أن شركة جوجل لا تكتفي بقبضتها على هذا العالم، فهي بصدد تجهيز مختبر أبحاث DeepMind الخاص بها لبناء نماذج توليدية قادرة على محاكاة العالم المادي. سيكون المشروع – الذي سيرأسه تيم بروكس، أحد القادة الذين ساعدوا في بناء مولد فيديو OpenAI، Sora – جزءًا مهمًا من محاولة الشركة لتحقيق الذكاء العام الاصطناعي، وفقًا لقوائم الوظائف المتعلقة بالفريق الجديد.
لدى بروكس، الذي انضم إلى DeepMind بعد فراره من OpenAI في أكتوبر، وفريقه “خطط طموحة لصنع نماذج توليدية ضخمة تحاكي العالم”. وفقًا لوصف الأدوار، فإن الجهود المبذولة لبناء نماذج عالمية “ستعمل على تعزيز العديد من المجالات، مثل التفكير البصري والمحاكاة، والتخطيط للوكلاء المتجسدين، والترفيه التفاعلي في الوقت الفعلي”. إذا كنت على استعداد لتولي أحد هذه الأدوار، فربما يمكنك معرفة ما تعنيه تلك الأمور الغامضة والعودة إلينا.
عادةً ما يسعى النموذج العالمي، المبسط قدر الإمكان، إلى محاكاة الطريقة التي يعمل بها العالم فعليًا. النماذج التوليدية مثل Sora قادرة على تكرار الأشياء التي شاهدتها من قبل ضمن بيانات التدريب الخاصة بها، وليس لديها أي فهم حقيقي لسبب حدوث ذلك الشيء. لذلك يمكنه بنجاح إنشاء مقطع فيديو لشخص يرمي كرة بيسبول، لكنه ليس لديه أي فهم لفيزياء ما يحدث. تهدف النماذج العالمية إلى تزويد الآلة بمعلومات كافية لتحليل كيفية حدوث الإجراء والنتيجة المحتملة له.
وصف يان ليكون، كبير علماء الذكاء الاصطناعي في ميتا، النماذج العالمية بهذه الطريقة خلال خطاب ألقاه في منتدى هدسون في وقت سابق من هذا العام: “النموذج العالمي هو نموذجك العقلي لكيفية تصرف العالم… يمكنك تخيل سلسلة من الإجراءات التي قد تتخذها، ونموذج العالم الخاص بك سيسمح لك بالتنبؤ بتأثير تسلسل العمل على العالم.
يصعب بناء النماذج العالمية لعدد من الأسباب، بما في ذلك الكم الهائل من الحوسبة اللازمة لتشغيل النموذج ونقص بيانات التدريب الكافية لإنشاء نموذج دقيق، مما يؤدي إلى أن معظم النماذج العالمية تعمل فقط في سياقات محدودة ومحددة.
يبدو أن فريق DeepMind عازم على توسيع نطاق النموذج العالمي. تتمثل الخطة في بناء أدوات “التوليد التفاعلي في الوقت الفعلي” فوق النماذج وربما النظر في كيفية دمج نموذجهم العالمي في نموذج اللغة الكبير من Google Gemini.
إحدى المجالات المحتملة التي ستحاول DeepMind معالجتها هي ألعاب الفيديو. يشير الوصف الوظيفي للفريق الجديد إلى أنهم سيتعاونون مع فريقي Veo وGenie في Google. Genie هو منشئ فيديو يشبه Sora من Google، وGenie هو نموذج عالمي موجود يمكنه محاكاة بيئات ثلاثية الأبعاد في الوقت الفعلي. صناعة ألعاب الفيديو حريصة بالفعل على اعتماد أدوات الذكاء الاصطناعي، مما يؤدي إلى تشريد الآلاف من العمال. وجد استطلاع أجرته شركة CVL Economics أن أكثر من 86% من جميع شركات الألعاب قد اعتمدت بالفعل أدوات الذكاء الاصطناعي التوليدية وأن ما يقرب من 15% من جميع وظائف الألعاب يمكن أن تتعطل بحلول عام 2026.
ربما يكون تحسين هذا العالم استخدامًا أفضل للوقت بدلاً من نمذجةه.