Close Menu
تقنية نيوزتقنية نيوز

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    مقالات قد تهمك

    تبدأ الآن لحظة تحقيق النجاح من Google للمنازل الذكية

    29 أكتوبر, 2025

    أنا سُرِقْتُ ثم حولت منزلي إلى حصن أمني ذكي مقابل 400 دولار

    29 أكتوبر, 2025

    ذهب العلماء للبحث عن قدرة شاكلتون على التحمل. لقد وجدوا مدينة الأسماك المخفية في تشكيل مثالي بدلاً من ذلك

    29 أكتوبر, 2025
    فيسبوك X (Twitter) الانستغرام
    • من نحن
    • سياسة الخصوصية
    • اتصل بنا
    فيسبوك X (Twitter) الانستغرام يوتيوب
    تقنية نيوزتقنية نيوز
    • الرئيسية
    • اخر الاخبار
    • هواتف ذكية
    • كمبيوتر
    • برامج وتطبيقات
    • شركات
      • ابل
      • سامسونج
      • جوجل
      • مايكروسوفت
      • أمازون
    • المزيد
      • الذكاء الإصطناعي
      • الأمن الإلكتروني
      • ألعاب
      • منوعات تقنية
    اشترك معنا
    تقنية نيوزتقنية نيوز
    الرئيسية » يوفر GPT-4o تفاعلًا مشابهًا للذكاء الاصطناعي مع تكامل النص والصوت والرؤية
    الذكاء الإصطناعي

    يوفر GPT-4o تفاعلًا مشابهًا للذكاء الاصطناعي مع تكامل النص والصوت والرؤية

    فريق التحريربواسطة فريق التحرير14 مايو, 20241 زيارةلا توجد تعليقات
    شاركها فيسبوك تويتر بينتيريست لينكدإن Tumblr رديت تيلقرام البريد الإلكتروني
    شاركها
    فيسبوك تويتر لينكدإن بينتيريست البريد الإلكتروني

    أطلقت OpenAI نموذجها الرائد الجديد، GPT-4o، الذي يدمج المدخلات والمخرجات النصية والصوتية والمرئية بسلاسة، ويعد بتعزيز طبيعة التفاعلات الآلية.

    تم تصميم GPT-4o، حيث يشير الحرف “o” إلى “omni”، لتلبية مجموعة واسعة من طرائق الإدخال والإخراج. أعلن OpenAI: “إنه يقبل أي مجموعة من النصوص والصوت والصورة كمدخلات ويولد أي مجموعة من مخرجات النص والصوت والصورة”.

    يمكن للمستخدمين توقع وقت استجابة يصل إلى 232 مللي ثانية، مما يعكس سرعة المحادثة البشرية، مع متوسط ​​وقت استجابة مثير للإعجاب يبلغ 320 مللي ثانية.

    قدرات رائدة

    يمثل إدخال GPT-4o قفزة عن سابقاتها من خلال معالجة جميع المدخلات والمخرجات من خلال شبكة عصبية واحدة. يمكّن هذا الأسلوب النموذج من الاحتفاظ بالمعلومات الهامة والسياق الذي تم فقده سابقًا في مسار النموذج المنفصل المستخدم في الإصدارات السابقة.

    قبل GPT-4o، كان بإمكان “وضع الصوت” التعامل مع التفاعلات الصوتية بزمن انتقال يبلغ 2.8 ثانية لـ GPT-3.5 و5.4 ثانية لـ GPT-4. تضمن الإعداد السابق ثلاثة نماذج متميزة: واحد لتحويل الصوت إلى نص، والآخر للاستجابات النصية، والثالث لتحويل النص إلى صوت مرة أخرى. أدى هذا التجزئة إلى فقدان الفروق الدقيقة مثل النغمة ومكبرات الصوت المتعددة وضوضاء الخلفية.

    كحل متكامل، يتميز GPT-4o بتحسينات ملحوظة في فهم الرؤية والصوت. يمكنه أداء مهام أكثر تعقيدًا مثل تنسيق الأغاني وتوفير الترجمات في الوقت الفعلي وحتى إنشاء مخرجات تحتوي على عناصر تعبيرية مثل الضحك والغناء. تشمل الأمثلة على قدراتها الواسعة الإعداد للمقابلات، وترجمة اللغات بسرعة، وإنشاء استجابات خدمة العملاء.

    علق ناثانيال ويتيمور، المؤسس والرئيس التنفيذي لشركة Superintelligent قائلاً: “ستكون إعلانات المنتجات بطبيعتها أكثر إثارة للانقسام من إعلانات التكنولوجيا لأنه من الصعب معرفة ما إذا كان المنتج سيكون مختلفًا حقًا حتى تتفاعل معه فعليًا. وخاصة عندما يتعلق الأمر بنمط مختلف من التفاعل بين الإنسان والحاسوب، هناك مجال أكبر للمعتقدات المتنوعة حول مدى فائدته.

    “ومع ذلك، فإن حقيقة عدم الإعلان عن GPT-4.5 أو GPT-5 تعمل أيضًا على صرف انتباه الناس عن التقدم التكنولوجي الذي يعتبره هذا نموذجًا متعدد الوسائط في الأصل. إنه ليس نموذج نصي مع إضافة صوت أو صورة؛ إنه رمز متعدد الوسائط للداخل، ورمز متعدد الوسائط للخارج. وهذا يفتح مجموعة كبيرة من حالات الاستخدام التي ستستغرق بعض الوقت حتى تصل إلى الوعي.”

    الأداء والسلامة

    يطابق GPT-4o مستويات أداء GPT-4 Turbo في مهام النص والترميز باللغة الإنجليزية ولكنه يتفوق بشكل كبير في اللغات غير الإنجليزية، مما يجعله نموذجًا أكثر شمولاً وتنوعًا. إنه يضع معيارًا جديدًا في التفكير مع درجة عالية تبلغ 88.7% في 0-shot COT MMLU (أسئلة المعرفة العامة) و87.2% في 5-shot no-CoT MMLU.

    يتفوق النموذج أيضًا في معايير الصوت والترجمة، متجاوزًا النماذج الحديثة السابقة مثل Whisper-v3. في التقييمات متعددة اللغات والرؤية، يُظهر أداءً فائقًا، مما يعزز قدرات OpenAI المتعددة اللغات والسمعية والبصرية.

    قامت OpenAI بدمج تدابير سلامة قوية في GPT-4o حسب التصميم، ودمج تقنيات لتصفية بيانات التدريب وتحسين السلوك من خلال ضمانات ما بعد التدريب. تم تقييم النموذج من خلال إطار الاستعداد ويتوافق مع التزامات OpenAI الطوعية. تشير التقييمات في مجالات مثل الأمن السيبراني والإقناع واستقلالية النموذج إلى أن GPT-4o لا يتجاوز مستوى المخاطرة “المتوسطة” عبر أي فئة.

    تضمنت تقييمات السلامة الإضافية تشكيل فريق أحمر خارجي واسع النطاق مع أكثر من 70 خبيرًا في مجالات مختلفة، بما في ذلك علم النفس الاجتماعي والتحيز والإنصاف والمعلومات المضللة. ويهدف هذا التدقيق الشامل إلى التخفيف من المخاطر التي تسببها الأساليب الجديدة لـGPT-4o.

    التوفر والتكامل في المستقبل

    بدءًا من اليوم، تتوفر إمكانيات النص والصورة الخاصة بـ GPT-4o في ChatGPT، بما في ذلك طبقة مجانية وميزات موسعة لمستخدمي Plus. سيدخل وضع الصوت الجديد المدعوم من GPT-4o في اختبار ألفا داخل ChatGPT Plus في الأسابيع المقبلة.

    يمكن للمطورين الوصول إلى GPT-4o من خلال واجهة برمجة التطبيقات (API) لمهام النص والرؤية، والاستفادة من سرعته المضاعفة وسعره المنخفض إلى النصف وحدود المعدل المحسنة مقارنةً بـ GPT-4 Turbo.

    تخطط OpenAI لتوسيع وظائف الصوت والفيديو الخاصة بـ GPT-4o لتشمل مجموعة مختارة من الشركاء الموثوقين عبر واجهة برمجة التطبيقات (API)، مع توقع طرحها على نطاق أوسع في المستقبل القريب. تهدف استراتيجية الإصدار المرحلي هذه إلى ضمان إجراء اختبار شامل للسلامة وسهولة الاستخدام قبل إتاحة النطاق الكامل للقدرات للعامة.

    “من المهم للغاية أنهم جعلوا هذا النموذج متاحًا مجانًا للجميع، بالإضافة إلى جعل واجهة برمجة التطبيقات (API) أرخص بنسبة 50%. وأوضح وايتمور أن هذه زيادة هائلة في إمكانية الوصول.

    تدعو OpenAI تعليقات المجتمع لتحسين GPT-4o بشكل مستمر، مع التركيز على أهمية مدخلات المستخدم في تحديد وسد الفجوات التي قد يظل فيها أداء GPT-4 Turbo متفوقًا.

    (حقوق الصورة: OpenAI)

    أنظر أيضا: تتخذ OpenAI خطوات لتعزيز شفافية المحتوى الناتج عن الذكاء الاصطناعي

    هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الضخمة من قادة الصناعة؟ اطلع على معرض الذكاء الاصطناعي والبيانات الضخمة الذي يقام في أمستردام وكاليفورنيا ولندن. ويقام هذا الحدث الشامل في موقع مشترك مع أحداث رائدة أخرى بما في ذلك مؤتمر الأتمتة الذكية، وBlockX، وأسبوع التحول الرقمي، ومعرض الأمن السيبراني والسحابي.

    استكشف الأحداث والندوات عبر الإنترنت القادمة الأخرى المتعلقة بتكنولوجيا المؤسسات والمدعومة من TechForge هنا.

    العلامات: الذكاء الاصطناعي، API، الذكاء الاصطناعي، المعايير، chatgpt، الترميز، المطورين، التطوير، gpt-4o، النموذج، الوسائط المتعددة، openai، الأداء، البرمجة

    شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr البريد الإلكتروني
    السابقلا تشكل برامج الفدية تهديدًا كبيرًا مثل عمليات الاحتيال هذه
    التالي ينتقل Jake Solomon من XCOM إلى نوع محاكاة الحياة في الاستوديو الجديد

    المقالات ذات الصلة

    الذكاء الإصطناعي

    يوفر فيديو AI مفتوح المصدر من Lightricks دقة 4K وصوتًا وعرضًا أسرع

    29 أكتوبر, 2025
    الذكاء الإصطناعي

    أفضل 5 أسواق حوسبة للذكاء الاصطناعي تعيد تشكيل المشهد في عام 2026

    29 أكتوبر, 2025
    الذكاء الإصطناعي

    تطلق RavenDB منشئ وكيل الذكاء الاصطناعي الأصلي لقاعدة البيانات لتبسيط تكامل الذكاء الاصطناعي للمؤسسات

    29 أكتوبر, 2025
    الذكاء الإصطناعي

    لماذا يعتبر عمل AMD مع وزارة الطاقة مهمًا لاستراتيجية الذكاء الاصطناعي للمؤسسات

    29 أكتوبر, 2025
    الذكاء الإصطناعي

    دليل المهندس لأتمتة أدوات DAST

    28 أكتوبر, 2025
    الذكاء الإصطناعي

    تقدم OpenAI خدمة ChatGPT Go مجانًا في الهند: تحليل استراتيجية التسويق

    28 أكتوبر, 2025
    الذكاء الإصطناعي

    إعادة هيكلة OpenAI، ودخول “الفصل التالي” من شراكة Microsoft

    28 أكتوبر, 2025
    الذكاء الإصطناعي

    كيفية إصلاح فجوة الثقة في الذكاء الاصطناعي في عملك

    27 أكتوبر, 2025
    الذكاء الإصطناعي

    إعادة الهندسة للحصول على نتائج أفضل: مجموعة Huawei AI

    27 أكتوبر, 2025
    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    Demo
    اخر الاخبار

    كيفية تسجيل مقاطع فيديو محمية بدون شاشة سوداء

    31 يوليو, 20241٬075 زيارة

    سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

    4 يوليو, 2024795 زيارة

    كل ما تريد معرفته عن Reacher الموسم الثالث

    6 مايو, 2024766 زيارة

    Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

    2 أبريل, 2024715 زيارة

    يحصل iPhone على أول تطبيق إباحي أصلي له

    4 فبراير, 2025680 زيارة

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    رائج الآن
    اخر الاخبار

    يحصل iPhone على أول تطبيق إباحي أصلي له

    فريق التحرير4 فبراير, 2025
    منوعات تقنية

    استخدم chatgpt بالعربي مجانا بدون تسجيل

    فريق التحرير29 مايو, 2025
    اخر الاخبار

    كيفية تسجيل مقاطع فيديو محمية بدون شاشة سوداء

    فريق التحرير31 يوليو, 2024
    رائج الآن

    يحصل iPhone على أول تطبيق إباحي أصلي له

    4 فبراير, 202521 زيارة

    استخدم chatgpt بالعربي مجانا بدون تسجيل

    29 مايو, 202518 زيارة

    كيفية تسجيل مقاطع فيديو محمية بدون شاشة سوداء

    31 يوليو, 202417 زيارة
    اختيارات المحرر

    تبدأ الآن لحظة تحقيق النجاح من Google للمنازل الذكية

    29 أكتوبر, 2025

    أنا سُرِقْتُ ثم حولت منزلي إلى حصن أمني ذكي مقابل 400 دولار

    29 أكتوبر, 2025

    ذهب العلماء للبحث عن قدرة شاكلتون على التحمل. لقد وجدوا مدينة الأسماك المخفية في تشكيل مثالي بدلاً من ذلك

    29 أكتوبر, 2025

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    تقنية نيوز
    فيسبوك X (Twitter) الانستغرام يوتيوب لينكدإن تيكتوك
    • الرئيسية
    • سياسة الخصوصية
    • من نحن
    • اتصل بنا
    © 2025 تقنية نيوز. جميع حقوق النشر محفوظة.

    اكتب كلمة البحث ثم اضغط على زر Enter