لقد انبهر الناس عندما ظهر ChatGPT، حيث أعجبوا بقدراته اللغوية الطبيعية باعتباره روبوت محادثة يعمل بالذكاء الاصطناعي والذي كان يعمل في الأصل بنموذج اللغة الكبير GPT-3.5. ولكن عندما ظهر نموذج اللغة الكبير GPT-4 الذي طال انتظاره، فقد كشف الغطاء عما كنا نعتقد أنه ممكن باستخدام الذكاء الاصطناعي، حيث وصفه البعض بأنه لمحات مبكرة من الذكاء الاصطناعي العام.
ما هو GPT-4؟
GPT-4 هو أحدث نموذج لغوي تم إنشاؤه بواسطة OpenAI والذي يمكنه إنشاء نص مشابه للكلام البشري. وهو يطور التكنولوجيا المستخدمة في ChatGPT، والتي كانت تستند في السابق إلى GPT-3.5 ولكن تم تحديثها منذ ذلك الحين. GPT هو اختصار لـ Generative Pre-trained Transformer، وهي تقنية تعلم عميق تستخدم الشبكات العصبية الاصطناعية للكتابة مثل الإنسان.
وفقًا لشركة OpenAI، فإن نموذج اللغة من الجيل التالي هذا أكثر تقدمًا من ChatGPT في ثلاثة مجالات رئيسية: الإبداع، والإدخال البصري، والسياق الأطول. من حيث الإبداع، تقول شركة OpenAI إن GPT-4 أفضل بكثير في كل من الإبداع والتعاون مع المستخدمين في المشاريع الإبداعية. تشمل الأمثلة على ذلك الموسيقى والسيناريوهات والكتابة الفنية وحتى “تعلم أسلوب الكتابة لدى المستخدم”.
يلعب السياق الأطول دورًا في هذا أيضًا. يمكن لـ GPT-4 الآن معالجة ما يصل إلى 128 ألف رمز نصي من المستخدم. يمكنك حتى إرسال رابط ويب إلى GPT-4 وطلب التفاعل مع النص من تلك الصفحة. تقول OpenAI إن هذا يمكن أن يكون مفيدًا لإنشاء محتوى طويل، بالإضافة إلى “المحادثات الموسعة”.
يستطيع برنامج GPT-4 الآن أيضًا استقبال الصور كأساس للتفاعل. في المثال المقدم على موقع GPT-4، يتم منح برنامج المحادثة صورة لبعض مكونات الخبز ويُسأل عما يمكن صنعه منها. ومن غير المعروف حاليًا ما إذا كان من الممكن أيضًا استخدام الفيديو بنفس الطريقة.
أخيرًا، تقول OpenAI أيضًا إن GPT-4 أكثر أمانًا للاستخدام من الجيل السابق. ويُقال إنه يمكنه إنتاج استجابات واقعية بنسبة 40% أكثر في الاختبارات الداخلية الخاصة بـ OpenAI، بينما يكون أيضًا أقل بنسبة 82% في “الاستجابة لطلبات المحتوى المحظور”.
وتقول شركة OpenAI إنها تلقت تدريبًا باستخدام ردود الفعل البشرية لتحقيق هذه الخطوات، مدعية أنها عملت مع “أكثر من 50 خبيرًا للحصول على ردود فعل مبكرة في مجالات بما في ذلك سلامة وأمن الذكاء الاصطناعي”.
في الأسابيع الأولى بعد إطلاقه، نشر المستخدمون بعض الأشياء المذهلة التي فعلوها به، بما في ذلك اختراع لغات جديدة، وتفصيل كيفية الهروب إلى العالم الحقيقي، وإنشاء رسوم متحركة معقدة للتطبيقات من الصفر. ويبدو أن أحد المستخدمين جعل GPT-4 ينشئ نسخة عاملة من Pong في ستين ثانية فقط، باستخدام مزيج من HTML وJavaScript.
كيفية استخدام GPT-4
يتوفر GPT-4 لجميع المستخدمين في كل مستوى اشتراك تقدمه OpenAI. سيتمكن مستخدمو المستوى المجاني من الوصول المحدود إلى نموذج GPT-4 الكامل (~80 محادثة خلال فترة 3 ساعات) قبل التبديل إلى GPT-4o mini الأصغر والأقل قدرة حتى تتم إعادة تعيين مؤقت التهدئة. للحصول على وصول إضافي إلى GPT-4، بالإضافة إلى القدرة على إنشاء صور باستخدام Dall-E، يجب الترقية إلى ChatGPT Plus. للانتقال إلى الاشتراك المدفوع بقيمة 20 دولارًا، ما عليك سوى النقر فوق “الترقية إلى Plus” في الشريط الجانبي في ChatGPT. بمجرد إدخال معلومات بطاقتك الائتمانية، ستتمكن من التبديل بين GPT-4 والإصدارات الأقدم من LLM.
إذا كنت لا ترغب في الدفع، فهناك بعض الطرق الأخرى لتذوق مدى قوة GPT-4. أولاً، يمكنك تجربته كجزء من Bing Chat من Microsoft. كشفت Microsoft أنها كانت تستخدم GPT-4 في Bing Chat، وهو مجاني تمامًا للاستخدام. ومع ذلك، فإن بعض ميزات GPT-4 مفقودة من Bing Chat، ومن الواضح أنها تم دمجها مع بعض تقنيات Microsoft الخاصة. ولكن لا يزال بإمكانك الوصول إلى نموذج اللغة الكبير الموسع والذكاء المتقدم الذي يأتي معه. تجدر الإشارة إلى أنه على الرغم من أن Bing Chat مجاني، إلا أنه يقتصر على 15 محادثة لكل جلسة و150 جلسة يوميًا.
هناك الكثير من التطبيقات الأخرى التي تستخدم GPT-4 حاليًا أيضًا، مثل موقع الإجابة على الأسئلة Quora.
متى تم إصدار GPT-4؟
تم الإعلان رسميًا عن GPT-4 في 13 مارس، كما أكدت شركة Microsoft مسبقًا، وأصبح متاحًا للمستخدمين لأول مرة من خلال اشتراك ChatGPT-Plus وMicrosoft Copilot. كما تم توفير GPT-4 كواجهة برمجة تطبيقات “للمطورين لبناء التطبيقات والخدمات”. بعض الشركات التي قامت بالفعل بدمج GPT-4 تشمل Duolingo وBe My Eyes وStripe وKhan Academy. تم بث أول عرض توضيحي عام لـ GPT-4 مباشرة على YouTube، لإظهار قدراته الجديدة.
ما هو GPT-4o mini؟
GPT-4o mini هو أحدث إصدار من خط نماذج GPT-4 من OpenAI. إنه نسخة مبسطة من نموذج GPT-4o الأكبر حجمًا والذي يناسب المهام البسيطة ولكن عالية الحجم والتي تستفيد أكثر من سرعة الاستدلال السريعة مقارنة بالاستفادة من قوة النموذج بالكامل.
تم إصدار GPT-4o mini في يوليو 2024 واستبدل GPT-3.5 باعتباره النموذج الافتراضي الذي يتفاعل معه المستخدمون في ChatGPT بمجرد وصولهم إلى حد الثلاث ساعات من الاستعلامات باستخدام GPT-4o. وفقًا للبيانات الواردة من Artificial Analysis، يتفوق 4o mini بشكل كبير على النماذج الصغيرة ذات الحجم المماثل مثل Google's Gemini 1.5 Flash وAnthropic's Claude 3 Haiku في معيار المنطق MMLU.
هل GPT-4 أفضل من GPT-3.5؟
كانت النسخة المجانية من ChatGPT في الأصل مبنية على طراز GPT 3.5؛ ومع ذلك، اعتبارًا من يوليو 2024، يعمل ChatGPT الآن على GPT-4o mini. هذه النسخة المبسطة من طراز GPT-4o الأكبر حجمًا أفضل كثيرًا من GPT-3.5 Turbo. يمكنها فهم المزيد من المدخلات والاستجابة لها، ولديها المزيد من الضمانات، وتوفر إجابات أكثر إيجازًا، وهي أقل تكلفة بنسبة 60% في التشغيل.
واجهة برمجة التطبيقات GPT-4
كما ذكرنا، يتوفر GPT-4 كواجهة برمجة تطبيقات للمطورين الذين قاموا بدفع دفعة ناجحة واحدة على الأقل لشركة OpenAI في الماضي. تقدم الشركة عدة إصدارات من GPT-4 للمطورين لاستخدامها من خلال واجهة برمجة التطبيقات الخاصة بها، إلى جانب نماذج GPT-3.5 القديمة. عند إصدار GPT-4o mini، أشارت OpenAI إلى أن GPT-3.5 سيظل متاحًا للاستخدام من قبل المطورين، على الرغم من أنه سيتم إيقافه في النهاية. لم تحدد الشركة جدولًا زمنيًا لمتى قد يحدث ذلك بالفعل.
تركز واجهة برمجة التطبيقات بشكل أساسي على المطورين الذين يقومون بإنشاء تطبيقات جديدة، ولكنها تسببت في بعض الارتباك للمستهلكين أيضًا. تتيح لك Plex دمج ChatGPT في مشغل الموسيقى Plexamp الخاص بالخدمة، والذي يتطلب مفتاح واجهة برمجة تطبيقات ChatGPT. هذا شراء منفصل عن ChatGPT Plus، لذا ستحتاج إلى التسجيل للحصول على حساب مطور للحصول على حق الوصول إلى واجهة برمجة التطبيقات إذا كنت تريد ذلك.
هل GPT-4 يتدهور؟
على الرغم من إعجاب الناس بـ GPT-4 عند إطلاقه لأول مرة، فقد لاحظ بعض المستخدمين تدهورًا في إجاباته على مدار الأشهر التالية. وقد لاحظه شخصيات مهمة في مجتمع المطورين، بل وتم نشره مباشرة على منتديات OpenAI. ومع ذلك، كان الأمر كله قصصيًا، حتى أن أحد المسؤولين التنفيذيين في OpenAI لجأ إلى Twitter لثنيهم عن الفكرة. وفقًا لـ OpenAI، فإن الأمر كله في رؤوسنا.
لا، لم نجعل GPT-4 أكثر غباءً. بل على العكس تمامًا: فنحن نجعل كل إصدار جديد أكثر ذكاءً من الإصدار السابق.
الفرضية الحالية: عندما تستخدمه بشكل مكثف، تبدأ في ملاحظة المشكلات التي لم تكن تراها من قبل.
— بيتر ويليندر (@npew) 13 يوليو 2023
ثم نُشرت دراسة أظهرت أن جودة الإجابات تدهورت بالفعل مع التحديثات المستقبلية للنموذج. وبمقارنة GPT-4 بين شهري مارس ويونيو، تمكن الباحثون من التأكد من أن دقة GPT-4 انخفضت من 97.6% إلى 2.4%.
إنه ليس دليلاً قاطعاً، لكن يبدو بالتأكيد أن ما يلاحظه المستخدمون ليس مجرد خيال.
أين يوجد الإدخال المرئي في GPT-4؟
تعد الإدخالات المرئية واحدة من أكثر الميزات المتوقعة في GPT-4، والتي تسمح لبرنامج ChatGPT Plus بالتفاعل مع الصور وليس فقط النصوص، مما يجعل النموذج متعدد الوسائط حقًا. إن تحميل الصور لتحليلها ومعالجتها بواسطة GPT-4 سهل مثل تحميل المستندات – ما عليك سوى النقر فوق أيقونة المشبك الورقي على يسار نافذة السياق، وتحديد مصدر الصورة وإرفاق الصورة بالموجه.
ما هي حدود GPT-4؟
أثناء مناقشة القدرات الجديدة لـ GPT-4، أشارت OpenAI أيضًا إلى بعض القيود المفروضة على نموذج اللغة الجديد. فمثل الإصدارات السابقة من GPT، تقول OpenAI إن أحدث نموذج لا يزال يعاني من مشاكل تتعلق بـ “التحيزات الاجتماعية والهلوسة والحوافز المعادية”.
بعبارة أخرى، إنه ليس مثاليًا. سيظل يجيب على الأسئلة بشكل خاطئ، وقد تم عرض العديد من الأمثلة على الإنترنت التي توضح حدوده. لكن شركة OpenAI تقول إن هذه كلها مشكلات تعمل الشركة على معالجتها، وبشكل عام، فإن GPT-4 “أقل إبداعًا” في الإجابات وبالتالي أقل عرضة لاختلاق الحقائق.
إن القيد الأساسي الآخر هو أن نموذج GPT-4 تم تدريبه على بيانات الإنترنت حتى ديسمبر 2023 (تم قطع GPT-4o و 4o mini في أكتوبر من ذلك العام). ومع ذلك، نظرًا لأن GPT-4 قادر على إجراء عمليات بحث على الويب وليس الاعتماد فقط على مجموعة البيانات المدربة مسبقًا، فيمكنه البحث بسهولة عن الحقائق الأحدث من الإنترنت وتعقبها.
GPT-4o هو الإصدار الأحدث بالطبع، ولا يزال GPT-5 قيد الإصدار.