قد لا يكون نموذج Orion من الجيل التالي من ChatGPT من OpenAI، والذي ترددت شائعات عنه ونفي وصوله بحلول نهاية العام، هو كل ما تم الترويج له بمجرد وصوله، وفقًا لتقرير جديد صادر عن The Information.
نقلاً عن موظفين مجهولين في OpenAI، يزعم التقرير أن نموذج Orion أظهر تحسنًا “أصغر بكثير” مقارنة بسابقه GPT-4 مقارنةً بـ GPT-4 الذي أظهره على GPT-3. وتشير هذه المصادر أيضًا إلى أن أوريون “ليس أفضل بشكل موثوق من سابقه (GPT-4) في التعامل مع مهام معينة”، وتحديدًا تطبيقات الترميز، على الرغم من أن النموذج الجديد أقوى بشكل ملحوظ في القدرات اللغوية العامة، مثل تلخيص المستندات أو إنشاء رسائل البريد الإلكتروني.
ويشير تقرير المعلومات إلى “تضاؤل المعروض من النصوص عالية الجودة وغيرها من البيانات” التي يمكن تدريب النماذج الجديدة عليها كعامل رئيسي في المكاسب غير الكبيرة التي يحققها النموذج الجديد. باختصار، تواجه صناعة الذكاء الاصطناعي بسرعة عنق الزجاجة المتعلق ببيانات التدريب، بعد أن جردت بالفعل المصادر السهلة لبيانات الوسائط الاجتماعية من مواقع مثل X، وفيسبوك، ويوتيوب (الأخير في مناسبتين مختلفتين). وعلى هذا النحو، أصبحت هذه الشركات على نحو متزايد يواجهون صعوبة في العثور على أنواع تحديات البرمجة المعقدة التي من شأنها أن تساعد في تطوير نماذجهم بما يتجاوز قدراتهم الحالية، مما يؤدي إلى إبطاء تدريبهم قبل الإصدار.
إن انخفاض كفاءة التدريب له آثار بيئية وتجارية هائلة. ومع نمو برامج الماجستير في القانون من الدرجة الحدودية ودفع أعداد معلماتها إلى تريليونات عالية، فمن المتوقع أن تتزايد كمية الطاقة والمياه والموارد الأخرى بمقدار ستة أضعاف في العقد المقبل. ولهذا السبب نرى Microsoft تحاول إعادة تشغيل Three Mile Island، وتشتري AWS محطة بقدرة 960 ميجاوات، وتشتري Google إنتاج سبعة مفاعلات نووية، كل ذلك لتوفير الطاقة اللازمة لمجموعتها المتنامية من مراكز بيانات الذكاء الاصطناعي – المركز الحالي للدولة. البنية التحتية للطاقة ببساطة لا تستطيع مواكبة ذلك.
ردًا على ذلك، وفقًا لتقارير TechCrunch، أنشأت OpenAI “فريق أسس” للتحايل على نقص بيانات التدريب المناسبة. يمكن أن تتضمن هذه التقنيات استخدام بيانات التدريب الاصطناعية، مثل ما يمكن لعائلة نماذج Nemotron من Nvidia توليده. ويتطلع الفريق أيضًا إلى تحسين أداء النموذج بعد التدريب.
Orion، الذي كان يُعتقد في الأصل أنه الاسم الرمزي لـ OpenAI's GPT-5، من المتوقع الآن أن يصل في وقت ما في عام 2025. وسواء كان لدينا ما يكفي من الطاقة المتاحة لرؤيته قيد التنفيذ، دون إتلاف شبكاتنا الكهربائية البلدية، يبقى أن نرى.