لقد رأينا جميعًا ذلك قادمًا، وقد أتى اليوم أخيرًا – يتحول ChatGPT ببطء إلى الذكاء الاصطناعي الودود في حيك، مع القدرة على الضحك بشكل مخيف بجانبك إذا قلت شيئًا مضحكًا، أو تعجب إذا كنت لطيفًا – وهذا مجرد خدش على سطح إعلانات اليوم. عقدت OpenAI للتو حدثًا خاصًا لتحديث الربيع، كشفت خلاله عن أحدث نموذج لغوي كبير (LLM) – GPT-4o. مع هذا التحديث، سيحصل ChatGPT على تطبيق سطح مكتب، وسيكون أفضل وأسرع، ولكن الأهم من ذلك كله، أنه يصبح متعدد الوسائط بالكامل.
بدأ الحدث بمقدمة قدمتها ميرا موراتي، المديرة التنفيذية للتكنولوجيا في OpenAI، والتي كشفت أن تحديثات اليوم لن تكون مخصصة فقط للمستخدمين المدفوعين – سيتم إطلاق GPT-4o عبر النظام الأساسي لكل من المستخدمين المجانيين والمشتركين المدفوعين. وقال موراتي: “إن الشيء المميز في GPT-4o هو أنه يقدم مستوى ذكاء GPT-4 للجميع، بما في ذلك مستخدمينا المجانيين”.
يُقال إن GPT-4o أسرع بكثير، ولكن الجزء المثير للإعجاب هو أنه يرفع الإمكانيات بضع درجات، عبر النص والرؤية والصوت. ويمكن للمطورين استخدامه أيضًا للتكامل مع واجهات برمجة التطبيقات (APIs) الخاصة بهم، ويقال إنه أسرع بما يصل إلى مرتين وأرخص بنسبة 50%، مع حد معدل أعلى بخمس مرات مقارنة بـ GPT-4 Turbo.
إلى جانب النموذج الجديد، تطلق OpenAI تطبيق ChatGPT لسطح المكتب بالإضافة إلى تحديث واجهة المستخدم على موقع الويب. الهدف هو جعل الدردشة الآلية سهلة التواصل معها قدر الإمكان. وقال موراتي: “نحن ننظر إلى مستقبل التفاعل بيننا وبين الآلات، ونعتقد أن GPT-4o يغير هذا النموذج بالفعل إلى مستقبل التعاون – حيث يصبح التفاعل أكثر طبيعية”.
ولتحقيق هذه الغاية، يبدو أن التحسينات الجديدة – التي عرضها موراتي بمساعدة مارك تشين وباريت زوف من OpenAI – تجعل التفاعل أكثر سلاسة. أصبح GPT-4o الآن قادرًا على تحليل مقاطع الفيديو والصور والكلام في الوقت الفعلي، ويمكنه تحديد المشاعر بدقة في الثلاثة. وهذا مثير للإعجاب بشكل خاص في ChatGPT Voice، الذي أصبح شبيهًا بالإنسان لدرجة أنه يلتف حول حافة الوادي الغريب.
يؤدي قول “مرحبًا” إلى ChatGPT إلى إثارة استجابة ودية وحماسية تحمل أدنى تلميح من مسحة آلية. عندما أخبر مارك تشين الذكاء الاصطناعي أنه كان يقدم عرضًا توضيحيًا مباشرًا ويحتاج إلى مساعدة ليهدأ، بدا الأمر منبهرًا بدرجة كافية وقفز إلى فكرة أنه يجب عليه أن يأخذ بعض الأنفاس العميقة. ولاحظت أيضًا أن تلك الأنفاس كانت سريعة جدًا – أشبه باللهاث حقًا – ووجهت تشين عبر الطريقة الصحيحة للتنفس، فأطلقت في البداية نكتة صغيرة: “أنت لست مكنسة كهربائية”.
تتدفق المحادثة بشكل طبيعي، حيث يمكنك الآن مقاطعة ChatGPT دون الحاجة إلى الانتظار حتى تنتهي، وتأتي الردود بسرعة دون أي توقفات محرجة. وعندما طُلب منه أن يروي قصة ما قبل النوم، استجاب للطلبات المتعلقة بنبرة صوته، التي تحولت من الحماسة إلى الدرامية إلى الآلية. أظهر النصف الثاني من العرض التوضيحي قدرة ChatGPT على قراءة التعليمات البرمجية بدقة، والمساعدة في حل المسائل الرياضية عبر الفيديو، وقراءة محتوى الشاشة ووصفه.
لم يكن العرض التوضيحي مثاليًا – بدا أن الروبوت ينقطع في بعض الأحيان، وكان من الصعب معرفة ما إذا كان ذلك بسبب تحدث شخص آخر أو بسبب زمن الاستجابة. ومع ذلك، فقد بدا الأمر وكأنه واقعي تمامًا كما يمكن توقعه من برنامج الدردشة الآلي، وقدرته على قراءة المشاعر البشرية والاستجابة لها بنفس القدر من الإثارة والإثارة للقلق. لم يكن سماع ضحكة ChatGPT مدرجًا في قائمة الأشياء التي اعتقدت أنني سأسمعها هذا الأسبوع، ولكن ها نحن ذا.
سيتم إطلاق GPT-4o، بتصميمه متعدد الوسائط، بالإضافة إلى تطبيق سطح المكتب، تدريجيًا خلال الأسابيع القليلة المقبلة. قبل بضعة أشهر، أخبرنا Bing Chat أنه يريد أن يكون إنسانيًا، ولكن الآن، نحن على وشك الحصول على نسخة من ChatGPT قد تكون قريبة من الإنسان كما رأينا منذ بداية طفرة الذكاء الاصطناعي.