بعد أشهر من التكهنات والتوقعات، أصدرت شركة OpenAI النسخة الإنتاجية من نموذجها المتقدم للاستدلال، Project Strawberry، والذي تمت إعادة تسميته بـ “o1”. وانضمت إليه نسخة “مصغرة” (تمامًا مثل GPT-4o) والتي ستوفر تفاعلات أسرع وأكثر استجابة على حساب الاستفادة من قاعدة معرفية أكبر.
يبدو أن o1 يقدم مزيجًا من التطورات التقنية. إنه أول نموذج في سلسلة نماذج التفكير التي طورتها OpenAI والتي صُممت لاستخدام الاستنتاج الشبيه بالاستنتاج البشري للإجابة على أسئلة معقدة حول مواضيع – بما في ذلك العلوم والترميز والرياضيات – بشكل أسرع من قدرة البشر.
على سبيل المثال، أثناء الاختبار، خضع o1 لاختبار تأهيلي لأولمبياد الرياضيات الدولي. وفي حين نجح سلفه، GPT-4o، في حل 13% فقط من المشكلات المقدمة بشكل صحيح، فقد حل o1 83% منها بشكل صحيح. وفي مسابقة Codeforces عبر الإنترنت، سجل o1 في النسبة المئوية 89. وعلاوة على ذلك، يمكن لـ o1 الرد على الاستفسارات التي حيرت النماذج السابقة (مثل، “أيهما أكبر، 9.11 أم 9.9؟”). ومع ذلك، توضح الشركة أن هذا الإصدار ليس سوى معاينة للقدرات الكاملة لنموذج المبتدئين.
قال جيري تووريك، كبير الباحثين في OpenAI، إن “الذكاء الاصطناعي الجديد o1 تم تدريبه باستخدام خوارزمية تحسين جديدة تمامًا ومجموعة بيانات تدريب جديدة مصممة خصيصًا له”. الحافة. وبحسب التقارير، فإن o1، باستخدام مزيج من التعلم التعزيزي والاستدلال “بسلسلة الأفكار”، يعطي استنتاجات أكثر دقة من سابقتها. وقال توورك: “لقد لاحظنا أن هذا النموذج يعاني من الهلوسة بدرجة أقل، ولكن لا يمكننا أن نقول إننا حللنا الهلوسة”.
سيتمكن مشتركو ChatGPT-Plus وTeams من اختبار o1 وo1-mini بدءًا من اليوم. ومن المقرر أن يتمكن مشتركو Enterprise وEdu من الوصول إلى الخدمة بحلول الأسبوع المقبل.
وتقول الشركة إن o1-mini سيصبح متاحًا في النهاية لمستخدمي المستوى المجاني، رغم أنها لم تحدد جدولًا زمنيًا. وسيلاحظ المطورون زيادة كبيرة في أسعار واجهة برمجة التطبيقات لـ o1، مقارنةً بـ GPT-4o. سيكلف الوصول إلى o1 15 دولارًا لكل مليون رمز إدخال (مقارنة بـ 5 دولارات لكل مليون لـ GPT-4o) و60 دولارًا لكل مليون رمز إخراج، أي أربعة أضعاف رسوم 4o البالغة 15 دولارًا لكل مليون. والسؤال الحقيقي هو ما إذا كان النموذج الجديد يعتقد أن كلمة “فراولة” تحتوي على حرفين R أو ثلاثة.