بعد يوم واحد من إطلاق المنتج الأكثر انتظارًا في عالم الكمبيوتر الشخصي، وهو عائلة بطاقات الرسوميات Nvidia GeForce 50، ظهر الرئيس التنفيذي لشركة Nvidia Jensen Huang على خشبة المسرح في معرض CES للإجابة على أسئلة الصحفيين.
سؤال رئيسي: في عالم يستخدم فيه الذكاء الاصطناعي بشكل متزايد لإنشاء الإطارات أو استيفاءها، فإن النتيجة النهائية هي عالم تكون فيه رسومات الكمبيوتر الشخصي تماما ولدت منظمة العفو الدولية؟ لا، أجاب هوانغ.
هناك سبب لطرحنا هذا السؤال على هوانغ. تقول Nvidia أنه بينما يمكن لـ DLSS 3 حقن إطارات تم إنشاؤها بواسطة الذكاء الاصطناعي بين كل إطار يتم عرضه بواسطة GPU، يمكن لـ DLSS 4 استنتاج ثلاثة إطارات كاملة من إطار تقليدي واحد، كما أشار براد تشاكوس في تقريرنا السابق حول الكشف عن سلسلة GeForce 50.
في اليوم السابق، تم طرح نفس السؤال على شركة AMD المنافسة. “هل يمكنني أن أخبرك أنه في المستقبل، سيتم إنشاء كل بكسل بواسطة ML (التعلم الآلي)؟ نعم بالتأكيد. أجاب فرانك أزور من AMD، كبير مهندسي حلول الألعاب، “سيكون ذلك في المستقبل”.
اختلف هوانغ. “لا، لقد أجاب على السؤال الذي طرحه آدم باتريك موراي من PCWorld.
“السبب في ذلك هو أنك تتذكر متى ظهر ChatGPT لأول مرة، وقلنا، أوه، الآن دعونا ننشئ الكتاب. لكن لا أحد يتوقع ذلك حالياً.
وتابع هوانغ: “والسبب في ذلك هو أنك تحتاج إلى منحها الفضل”. “عليك أن تعطيه – إنه يسمى الشرط. نقوم الآن بتكييف الدردشة أو المطالبات مع السياق. قبل أن تتمكن من الإجابة على سؤال، عليك أن تفهم العملية. يمكن أن يكون السياق PDF، ويمكن أن يكون السياق بحثًا على الويب. يمكن أن تخبرنا السياق بالضبط ما هو السياق، أليس كذلك؟
“وهكذا ينطبق الشيء نفسه على ألعاب الفيديو. عليك أن تعطي السياق. وسياق ألعاب الفيديو لا يجب أن يكون مرتبطًا بالقصة فحسب، بل يجب أن يكون مكانيًا وعالميًا وذو صلة مكانيًا. وبالتالي فإن الطريقة التي تشروط بها، والطريقة التي تعطيها سياقًا، هي أن تعطيها بعض الأجزاء المبكرة من الهندسة، أو الأجزاء المبكرة من الأنسجة، ويمكنها أن تولد، ويمكن أن تكمل الباقي.
في ChatGPT، يسمى السياق الاسترداد السريع، الأجيال المعززة (RAG)، وهو السياق الذي يوجه الإخراج النصي. وقال: “في المستقبل، ستكون الرسومات ثلاثية الأبعاد بمثابة توليد حالة مؤرضة ثلاثية الأبعاد”.
وقال هوانغ إنه في DLSS 4، يعرض محرك التنقيط GPU الخاص بـ Nvidia واحدًا فقط من الإطارات الأربعة التطلعية. “وهكذا، من بين الإطارات الأربعة، 33 مليون بكسل، قمنا بعرض اثنين فقط (مليون). أليست هذه معجزة؟”
وقال هوناج إن المفتاح هو أنه يجب تقديمها بدقة: “بالضبط الصحيح منها، ومن هذا التكييف يمكننا توليد الآخرين”.
“سوف يحدث نفس الشيء في ألعاب الفيديو في المستقبل الذي وصفته للتو، سيحدث ليس فقط لوحدات البكسل التي نعرضها، ولكن أيضًا للهندسة التي نعرضها، والرسوم المتحركة التي نعرضها، كما تعلمون، والشعر نعرضها في ألعاب الفيديو المستقبلية.
اعتذر هوانغ إذا كان تفسيره سيئًا، لكنه خلص إلى أنه لا يزال وسيظل هناك دائمًا دور للفنانين والعرض في ألعاب الفيديو. “لكن الأمر استغرق وقتًا طويلاً حتى يدرك الجميع الآن أن الذكاء الاصطناعي التوليدي هو المستقبل حقًا، ولكن عليك أن تتكيف، وتحتاج إلى التواصل مع المؤلف والفنانين و(والنية)”.