كشفت OpenAI النقاب عن GPT-4 Omni (GPT-4o) خلال مؤتمرها تحديث الربيع صباح يوم الاثنين في سان فرانسيسكو. عرض الرئيس التنفيذي للتكنولوجيا ميرا موراتي وموظفو OpenAI أحدث طرازهم الرائد، القادر على إجراء محادثات لفظية في الوقت الفعلي مع برنامج دردشة آلي ودود يعمل بالذكاء الاصطناعي ويتحدث بشكل مقنع مثل الإنسان.
وقال موراتي على خشبة المسرح: “يوفر GPT-4o ذكاءً بمستوى GPT-4 ولكنه أسرع بكثير”. “نعتقد أن GPT-4o يحول هذا النموذج بالفعل إلى مستقبل التعاون، حيث يصبح هذا التفاعل أكثر طبيعية وأسهل بكثير.”
جي بي تي-40 يستجيب بشكل فوري للمطالبات اللفظية بصوت ودود يبدو غريبًا مثل سكارليت جوهانسون، التي عبرت عن مساعد الذكاء الاصطناعي في الفيلم الطويل ها. واستنادا إلى العروض التوضيحية، فإن هذه التكنولوجيا تجعل هذا الفيلم حقيقة واقعة. يتميز خطاب GPT-4o بنبرة عاطفية، حيث يظهر الإثارة في بعض الأحيان ويضحك في أوقات أخرى. علاوة على ذلك، يمكنه تحديد المشاعر والنبرة في كلام المستخدمين أيضًا. عرض موظفو OpenAI المحادثات مع روبوتات الدردشة المدعمة بالذكاء الاصطناعي دون أي تأخير تقريبًا، وكان روبوت الدردشة قادرًا على الدوران بسرعة عند مقاطعته.
في حين أن القدرات الصوتية لـ GPT-4o مثيرة للإعجاب، إلا أن Omni يعمل في عدة وسائط. في حين قام ChatGPT سابقًا بمعالجة النص والرؤية والصوت من خلال شبكة من نماذج الذكاء الاصطناعي، فإن GPT-4o هو نموذج واحد قادر على معالجة الثلاثة جميعًا. وهذا يجعل كل شيء يعمل بشكل أسرع بكثير. يمكنك إظهار صورة لمسألة رياضية لـ GPT-4o باستخدام كاميرا هاتفك أثناء التحدث إلى العارضة لفظيًا. تقول OpenAI إن نموذجها الرئيسي الجديد يعمل بمستويات الذكاء GPT-4 مع وضع علامات مائية رائدة على القدرات المتعددة اللغات والصوت والرؤية.
بعد هذا العرض التوضيحي المذهل، تقوم OpenAI بإصدار GPT-4o كتطبيق سطح مكتب لنظام التشغيل macOS. يحصل المستخدمون المدفوعون أيضًا على تطبيق macOS اليوم، لكن GPT-4o سيكون متاحًا للمستخدمين مجانًا في المستقبل. سيسمح لك تطبيق سطح المكتب ببدء المحادثات الصوتية مع ChatGPT مباشرة من جهاز الكمبيوتر الخاص بك، ومشاركة شاشتك بأقل قدر من الاحتكاك. يحصل موقع ChatGPT أيضًا على تحديث مبسط.
قام مارك تشن وباريت زوف من فريق عمل OpenAI بعرض كيفية عمل نموذج الذكاء الاصطناعي متعدد الوسائط في الوقت الفعلي على خشبة المسرح يوم الاثنين. كانت المحادثة في الوقت الفعلي ناجحة في الغالب، حيث قاطع تشين وزوف النموذج ليطلبا منه إجراء إجابات محورية. يروي GPT-4o قصصًا قبل النوم، ويساعد في حل مسائل الرياضيات، وغير ذلك الكثير. في بعض الأحيان، واجه GPT-4 Omni صعوبات في فهم نية المستخدمين، لكن النموذج كان رائعًا إلى حد ما في التعامل مع الأخطاء.
كان النموذج الصوتي قادرًا على إصدار أصوات مختلفة عند رواية قصة أو الضحك أو حتى قول “هذا لطف منك” في وقت ما. من الواضح أن فريق OpenAI تأكد من أن GPT-4o يتمتع بمزيد من العاطفة وكان أكثر تخاطبًا من النماذج الصوتية السابقة. في العروض التوضيحية، بدا ChatGPT أكثر إنسانية من أي وقت مضى.
أكد أحد موظفي OpenAI في تغريدة ذلك قامت الشركة باختبار GPT-4o على ساحة الدردشة الآلية LMSYS Org باسم “im-also-a-good-gpt2-chatbot.” كما شكك الكثيرون وتساءل سام ألتمان، كانت هذه نماذج OpenAI قيد العمل. وفقًا لأحد الموظفين، تفوقت أحدث برامج الدردشة الآلية بشكل صارخ على المنافسين، بما في ذلك رواد الصناعة GPT-4 Turbo وClaude 3 Opus، وفقًا لعدة مقاييس.
يبدو إصدار GPT-4o بمثابة لحظة حاسمة بالنسبة لمستقبل روبوتات الدردشة التي تعمل بالذكاء الاصطناعي. تتغلب هذه التكنولوجيا على الكثير من فترات الاستجابة المحرجة التي ابتليت بها روبوتات الدردشة المبكرة. من السهل أن نتخيل نسخة من Siri مفيدة جدًا مع GPT-4o. من المحتمل أن تكون هذه القدرات في الوقت الفعلي بفضل أحدث شرائح الاستدلال من Nvidia، والتي كان من المؤكد أن موراتي سيستدعيها قبل إنهاء العرض التقديمي. وبغض النظر عن ذلك، أكدت OpenAI مجددًا مكانتها المهيمنة كرائدة في ابتكارات الذكاء الاصطناعي من خلال العرض التوضيحي يوم الاثنين. الآن، ننتظر لنرى ما إذا كان العرض التقديمي قد أعطانا تصويرًا دقيقًا لما يمكن أن يفعله هذا الشيء، أو ما إذا كان قد تم إدارته بعناية لتجنب العيوب الواضحة.