أعلنت شركة OpenAI عن إطلاق أحدث نموذج توليدي صغير الحجم، والذي أطلق عليه اسم GPT-4o mini، والذي يتطلب موارد أقل وأرخص في التشغيل من نموذج GPT-4o القياسي، مما يسمح للمطورين بدمج تقنية الذكاء الاصطناعي في مجموعة أوسع بكثير من المنتجات.
إنه ترقية كبيرة للمطورين والتطبيقات، ولكنه يوسع أيضًا الإمكانيات ويقلل القيود المفروضة على الإصدار المجاني من ChatGPT. يتوفر GPT-4o mini الآن للمستخدمين في المستويات المجانية وPlus وTeam من خلال موقع ChatGPT وتطبيقه للمستخدمين والمطورين بدءًا من اليوم، بينما سيتمكن مشتركو ChatGPT Enterprise من الوصول إليه الأسبوع المقبل. سيحل GPT-4o mini محل النموذج الصغير الحالي للشركة، GPT-3.5 Turbo، للمستخدمين النهائيين بدءًا من اليوم.
لا يزال الطراز الأقدم متاحًا للمطورين من خلال واجهة برمجة التطبيقات (API) إذا لم يرغبوا في التبديل إلى 4o mini حتى الآن. وتقول الشركة إنها ستوقف الطراز الأقدم في نهاية المطاف ولكنها لم تحدد موعدًا بعد.
كان GPT-4o متاحًا لحسابات ChatGPT المجانية منذ شهر مايو، ولكن كانت هناك قيود حول الطلب. وفقًا لصفحة الأسئلة الشائعة المحدثة، لا يزال GPT-4o لديه هذه القيود، ولكنك ستتم الآن تخفيض إصدارك إلى GPT-4o mini بدلاً من GPT-3.5 عند الوصول إلى الحد الأقصى. من الناحية النظرية، يعد هذا فوزًا كبيرًا لأولئك الذين لم يقوموا بالترقية إلى ChatGPT Plus.
نحن نواصل جعل الذكاء الاصطناعي المتقدم متاحًا للجميع من خلال إطلاق GPT-4o mini، المتوفر الآن في واجهة برمجة التطبيقات ويتم طرحه في ChatGPT اليوم. https://t.co/sTxtOfUapJ
— OpenAI (@OpenAI) 18 يوليو 2024
وفقًا للبيانات الواردة من Artificial Analysis، سجل أحدث نموذج ذكاء اصطناعي من OpenAI نسبة 82% في معيار MMLU، متفوقًا على Gemini 1.5 Flash بنسبة 3% وClaude 3 Haiku بنسبة 7%. للإشارة، تم تحديد أعلى معيار MMLU حتى الآن بواسطة Gemini Ultra، أفضل ذكاء اصطناعي من Google، بنسبة 90%.
علاوة على ذلك، تزعم OpenAI أن تشغيل GPT-4o mini أرخص بنسبة 60% من تشغيل GPT-3.5 Turbo. سيدفع المطورون 15 سنتًا لكل مليون رمز إدخال و60 سنتًا لكل مليون رمز إخراج. تقول OpenAI أن GPT-4o mini هو “النموذج الصغير الأكثر كفاءة وفعالية من حيث التكلفة المتاح اليوم”، وفقًا لشبكة CNBC.
من أين تأتي هذه التوفيرات في التكاليف؟ حسنًا، ليست كل مهمة يمكن تحسينها بواسطة الذكاء الاصطناعي تحتاج إلى الوزن الكامل وقدرة نموذج كامل الحجم مثل GPT أو Claude أو Gemini. مثل ضرب الذباب بمطرقة ثقيلة، فإن استخدام LLM بحجم قياسي للمهام البسيطة ولكن عالية الحجم أمر مبالغ فيه ويهدر المال وموارد الحوسبة – وهنا يأتي دور LLMs الصغيرة مثل Gemini 1.5 Flash من Google أو Llama 3 8b من Meta أو Claude 3 Haiku من Anthropic. إنها قادرة على أداء هذه المهام البسيطة المتكررة بشكل أسرع وأكثر كفاءة من حيث التكلفة من التكرارات الأكبر.
وفقًا لشركة OpenAI، سيحتوي GPT-4o mini على نفس حجم نافذة السياق، 128000 رمز (ما يعادل تقريبًا محتوى كتاب)، مثل الإصدار بالحجم الكامل بنفس حد المعرفة أيضًا، في أكتوبر 2023، على الرغم من أن الشركة لم تحدد الحجم الدقيق للنموذج الجديد. لا تقدم واجهة برمجة التطبيقات للنموذج حاليًا سوى إمكانيات النص والرؤية، ولكن سيتم توفير الفيديو والصوت في المستقبل أيضًا.
يأتي هذا الإعلان بعد أسابيع قليلة من تقديم OpenAI تحديثًا طال انتظاره لوضع Voice Mode المتقدم المتوقع كجزء من GPT-4o. وأشار تحديث الشركة إلى أنه لا يزال من المقرر إصدار إصدار ألفا أصغر حجمًا في أواخر يوليو، مع طرح أوسع نطاقًا في الخريف.