OpenAI تكشف عن القدرات الصوتية لـ GPT-4 Omni وهي لا تصدق حرفيًا

كشفت OpenAI النقاب عن GPT-4 Omni (GPT-4o) خلال مؤتمرها تحديث الربيع صباح يوم الاثنين في سان فرانسيسكو. عرض الرئيس التنفيذي للتكنولوجيا ميرا موراتي وموظفو OpenAI أحدث طرازهم الرائد، القادر على إجراء محادثات لفظية في الوقت الفعلي مع برنامج دردشة آلي ودود يعمل بالذكاء الاصطناعي ويتحدث بشكل مقنع مثل الإنسان.

لماذا يقاضي الجميع شركات الذكاء الاصطناعي؟ | تكنولوجيا المستقبل

وقال موراتي على خشبة المسرح: “يوفر GPT-4o ذكاءً بمستوى GPT-4 ولكنه أسرع بكثير”. “نعتقد أن GPT-4o يحول هذا النموذج بالفعل إلى مستقبل التعاون، حيث يصبح هذا التفاعل أكثر طبيعية وأسهل بكثير.”

جي بي تي-40 يستجيب بشكل فوري للمطالبات اللفظية بصوت ودود يبدو غريبًا مثل سكارليت جوهانسون، التي عبرت عن مساعد الذكاء الاصطناعي في الفيلم الطويل ها. واستنادا إلى العروض التوضيحية، فإن هذه التكنولوجيا تجعل هذا الفيلم حقيقة واقعة. يتميز خطاب GPT-4o بنبرة عاطفية، حيث يظهر الإثارة في بعض الأحيان ويضحك في أوقات أخرى. علاوة على ذلك، يمكنه تحديد المشاعر والنبرة في كلام المستخدمين أيضًا. عرض موظفو OpenAI المحادثات مع روبوتات الدردشة المدعمة بالذكاء الاصطناعي دون أي تأخير تقريبًا، وكان روبوت الدردشة قادرًا على الدوران بسرعة عند مقاطعته.

في حين أن القدرات الصوتية لـ GPT-4o مثيرة للإعجاب، إلا أن Omni يعمل في عدة وسائط. في حين قام ChatGPT سابقًا بمعالجة النص والرؤية والصوت من خلال شبكة من نماذج الذكاء الاصطناعي، فإن GPT-4o هو نموذج واحد قادر على معالجة الثلاثة جميعًا. وهذا يجعل كل شيء يعمل بشكل أسرع بكثير. يمكنك إظهار صورة لمسألة رياضية لـ GPT-4o باستخدام كاميرا هاتفك أثناء التحدث إلى العارضة لفظيًا. تقول OpenAI إن نموذجها الرئيسي الجديد يعمل بمستويات الذكاء GPT-4 مع وضع علامات مائية رائدة على القدرات المتعددة اللغات والصوت والرؤية.

بعد هذا العرض التوضيحي المذهل، تقوم OpenAI بإصدار GPT-4o كتطبيق سطح مكتب لنظام التشغيل macOS. يحصل المستخدمون المدفوعون أيضًا على تطبيق macOS اليوم، لكن GPT-4o سيكون متاحًا للمستخدمين مجانًا في المستقبل. سيسمح لك تطبيق سطح المكتب ببدء المحادثات الصوتية مع ChatGPT مباشرة من جهاز الكمبيوتر الخاص بك، ومشاركة شاشتك بأقل قدر من الاحتكاك. يحصل موقع ChatGPT أيضًا على تحديث مبسط.

قام مارك تشن وباريت زوف من فريق عمل OpenAI بعرض كيفية عمل نموذج الذكاء الاصطناعي متعدد الوسائط في الوقت الفعلي على خشبة المسرح يوم الاثنين. كانت المحادثة في الوقت الفعلي ناجحة في الغالب، حيث قاطع تشين وزوف النموذج ليطلبا منه إجراء إجابات محورية. يروي GPT-4o قصصًا قبل النوم، ويساعد في حل مسائل الرياضيات، وغير ذلك الكثير. في بعض الأحيان، واجه GPT-4 Omni صعوبات في فهم نية المستخدمين، لكن النموذج كان رائعًا إلى حد ما في التعامل مع الأخطاء.

كان النموذج الصوتي قادرًا على إصدار أصوات مختلفة عند رواية قصة أو الضحك أو حتى قول “هذا لطف منك” في وقت ما. من الواضح أن فريق OpenAI تأكد من أن GPT-4o يتمتع بمزيد من العاطفة وكان أكثر تخاطبًا من النماذج الصوتية السابقة. في العروض التوضيحية، بدا ChatGPT أكثر إنسانية من أي وقت مضى.

أكد أحد موظفي OpenAI في تغريدة ذلك قامت الشركة باختبار GPT-4o على ساحة الدردشة الآلية LMSYS Org باسم “im-also-a-good-gpt2-chatbot.” كما شكك الكثيرون وتساءل سام ألتمان، كانت هذه نماذج OpenAI قيد العمل. وفقًا لأحد الموظفين، تفوقت أحدث برامج الدردشة الآلية بشكل صارخ على المنافسين، بما في ذلك رواد الصناعة GPT-4 Turbo وClaude 3 Opus، وفقًا لعدة مقاييس.

يبدو إصدار GPT-4o بمثابة لحظة حاسمة بالنسبة لمستقبل روبوتات الدردشة التي تعمل بالذكاء الاصطناعي. تتغلب هذه التكنولوجيا على الكثير من فترات الاستجابة المحرجة التي ابتليت بها روبوتات الدردشة المبكرة. من السهل أن نتخيل نسخة من Siri مفيدة جدًا مع GPT-4o. من المحتمل أن تكون هذه القدرات في الوقت الفعلي بفضل أحدث شرائح الاستدلال من Nvidia، والتي كان من المؤكد أن موراتي سيستدعيها قبل إنهاء العرض التقديمي. وبغض النظر عن ذلك، أكدت OpenAI مجددًا مكانتها المهيمنة كرائدة في ابتكارات الذكاء الاصطناعي من خلال العرض التوضيحي يوم الاثنين. الآن، ننتظر لنرى ما إذا كان العرض التقديمي قد أعطانا تصويرًا دقيقًا لما يمكن أن يفعله هذا الشيء، أو ما إذا كان قد تم إدارته بعناية لتجنب العيوب الواضحة.

مقالات قد تهمك

توقفت سماعات AirPods Max الأصلية عن العمل، فتم وضعها في الثلاجة.

تحصل خرائط جوجل على الذكاء الاصطناعي للمحادثة والتنقل ثلاثي الأبعاد في تحديث كبير.

هل الذهاب لمشاهدة (السلام عليك يا مريم) مع هذا المجسم الفضائي المطبوع ثلاثي الأبعاد؟

سوريَة والأردن: مباحثات لتطوير الخدمات البريدية ودعم التجارة الإلكترونية

عرضٌ لمدى الحياة لحزمة VPN ومدير كلمات مرور بسعر 40 دولارًا.

آبل تحتفل باليوبيل الذهبي.. 50 عامًا من النجاح في القطاع التقني

الأفلام والعروض التي تُعرض في أبريل 2026.

error code: 524

تبلغ تكلفة بيئة التطوير المتكاملة (IDE) لسطح المكتب 42.49 دولارًا أمريكيًا بدلًا من 499.99 دولارًا.

توقف عن الانتظار – قم بالترقية إلى Windows 11 Pro مقابل 13 دولارًا. توقف عن الانتظار – الترقية إلى Windows 11 Pro متاحة مقابل 13 دولارًا.

صممت سامسونج لوحات شاشات OLED جديدة لمقاومة الانعكاس والخدوش.

تعرّف على نظام الري الذكي “Aiper IrriSense 2” لتحسين الحدائق في الربيع.

مقارنة بين Samsung Galaxy Z Fold 6 و Galaxy S24 Ultra: لا تخطئ

يحصل iPhone على أول تطبيق إباحي أصلي له

سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

كل ما تريد معرفته عن Reacher الموسم الثالث

Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

إليك أحدث أكواد فري فاير Free Fire Codes المجانية 2025 وشرح طريقة تفعيلها

استخدم chatgpt بالعربي مجانا بدون تسجيل

كيفية تنزيل مقاطع فيديو يوتيوب بدقة 4K و8K.

رائج الآن