Close Menu
تقنية نيوزتقنية نيوز
    مقالات قد تهمك

    محادثات مدير “كيفية تدريب التنين الخاص بك” يعزز قوس جيرارد بتلر

    11 يونيو, 2025

    هذه بطاقة الرسومات RTX 5070 المعدلة تخفي جهاز كمبيوتر مصغر كامل داخل

    11 يونيو, 2025

    الكشف عن متطلبات تشغيل Jurassic World Evolution 3 على الحاسب الشخصي

    11 يونيو, 2025
    فيسبوك X (Twitter) الانستغرام
    • من نحن
    • سياسة الخصوصية
    • اتصل بنا
    فيسبوك X (Twitter) الانستغرام يوتيوب
    تقنية نيوزتقنية نيوز
    • الرئيسية
    • اخر الاخبار
    • هواتف ذكية
    • كمبيوتر
    • برامج وتطبيقات
    • شركات
      • ابل
      • سامسونج
      • جوجل
      • مايكروسوفت
      • أمازون
    • المزيد
      • الذكاء الإصطناعي
      • الأمن الإلكتروني
      • ألعاب
      • منوعات تقنية
    اشترك معنا
    تقنية نيوزتقنية نيوز
    الرئيسية » يعمل OpenAI على تعزيز سلامة الذكاء الاصطناعي من خلال أساليب الفريق الأحمر الجديدة
    الذكاء الإصطناعي

    يعمل OpenAI على تعزيز سلامة الذكاء الاصطناعي من خلال أساليب الفريق الأحمر الجديدة

    فريق التحريربواسطة فريق التحرير22 نوفمبر, 20240 زيارةلا توجد تعليقات
    شاركها فيسبوك تويتر بينتيريست لينكدإن Tumblr رديت تيلقرام البريد الإلكتروني
    شاركها
    فيسبوك تويتر لينكدإن بينتيريست البريد الإلكتروني

    جزء مهم من عملية الحماية في OpenAI هو “الفريق الأحمر” – وهي منهجية منظمة تستخدم كلاً من المشاركين من البشر والذكاء الاصطناعي لاستكشاف المخاطر ونقاط الضعف المحتملة في الأنظمة الجديدة.

    تاريخيًا، انخرطت شركة OpenAI في جهود الفريق الأحمر في الغالب من خلال الاختبار اليدوي، والذي يتضمن قيام الأفراد بالبحث عن نقاط الضعف. وقد تم استخدام هذا بشكل ملحوظ أثناء اختبار نموذج توليد الصور DALL · E 2 في أوائل عام 2022، حيث تمت دعوة خبراء خارجيين لتحديد المخاطر المحتملة. منذ ذلك الحين، قامت OpenAI بتوسيع وتحسين منهجياتها، ودمج الأساليب الآلية والمختلطة لتقييم أكثر شمولاً للمخاطر.

    صرح OpenAI قائلاً: “نحن متفائلون بأننا نستطيع استخدام ذكاء اصطناعي أكثر قوة لتوسيع نطاق اكتشاف أخطاء النماذج”. يعود هذا التفاؤل إلى فكرة أن العمليات الآلية يمكن أن تساعد في تقييم النماذج وتدريبها لتكون أكثر أمانًا من خلال التعرف على الأنماط والأخطاء على نطاق أوسع.

    في أحدث مساعيها للتقدم، تشارك OpenAI وثيقتين مهمتين حول الفريق الأحمر – ورقة بيضاء توضح بالتفصيل استراتيجيات المشاركة الخارجية ودراسة بحثية تقدم طريقة جديدة للفريق الأحمر الآلي. تهدف هذه المساهمات إلى تعزيز عملية ونتائج الفريق الأحمر، مما يؤدي في النهاية إلى تطبيقات ذكاء اصطناعي أكثر أمانًا ومسؤولية.

    مع استمرار تطور الذكاء الاصطناعي، يعد فهم تجارب المستخدم وتحديد المخاطر مثل إساءة الاستخدام وسوء الاستخدام أمرًا بالغ الأهمية للباحثين والمطورين. يوفر الفريق الأحمر طريقة استباقية لتقييم هذه المخاطر، خاصة عند استكمالها برؤى من مجموعة من الخبراء الخارجيين المستقلين. ولا يساعد هذا النهج في وضع معايير فحسب، بل يسهل أيضًا تعزيز تقييمات السلامة بمرور الوقت.

    اللمسة الإنسانية

    شاركت OpenAI أربع خطوات أساسية في ورقتها البيضاء، “نهج OpenAI تجاه الفريق الأحمر الخارجي لنماذج وأنظمة الذكاء الاصطناعي،” لتصميم حملات فعالة للفريق الأحمر:

    1. تشكيل الفرق الحمراء: يعتمد اختيار أعضاء الفريق على أهداف الحملة. يتضمن هذا غالبًا أفرادًا ذوي وجهات نظر متنوعة، مثل الخبرة في العلوم الطبيعية والأمن السيبراني والسياسة الإقليمية، مما يضمن أن التقييمات تغطي النطاق اللازم.
    1. الوصول إلى الإصدارات النموذجية: إن توضيح إصدارات النموذج التي سيتمكن أعضاء الفريق الأحمر من الوصول إليها يمكن أن يؤثر على النتائج. قد تكشف نماذج المرحلة المبكرة عن المخاطر الكامنة، في حين أن الإصدارات الأكثر تطوراً يمكن أن تساعد في تحديد الثغرات في عمليات تخفيف السلامة المخطط لها.
    1. التوجيه والتوثيق: تعتمد التفاعلات الفعالة أثناء الحملات على تعليمات واضحة وواجهات مناسبة ووثائق منظمة. يتضمن ذلك وصف النماذج والضمانات الحالية وواجهات الاختبار والمبادئ التوجيهية لتسجيل النتائج.
    1. تجميع البيانات وتقييمها: بعد الحملة، يتم تقييم البيانات لتحديد ما إذا كانت الأمثلة تتوافق مع السياسات الحالية أو تتطلب تعديلات سلوكية جديدة. ثم تقوم البيانات التي تم تقييمها بإبلاغ التقييمات القابلة للتكرار للتحديثات المستقبلية.

    تضمن أحد التطبيقات الحديثة لهذه المنهجية إعداد مجموعة نماذج OpenAI o1 للاستخدام العام، واختبار مدى مقاومتها لإساءة الاستخدام المحتملة وتقييم تطبيقها في مجالات مختلفة مثل التخطيط للهجمات في العالم الحقيقي، والعلوم الطبيعية، وأبحاث الذكاء الاصطناعي.

    الفريق الأحمر الآلي

    يسعى الفريق الأحمر الآلي إلى تحديد الحالات التي قد يفشل فيها الذكاء الاصطناعي، خاصة فيما يتعلق بالقضايا المتعلقة بالسلامة. تتفوق هذه الطريقة على نطاق واسع، وتنتج أمثلة عديدة للأخطاء المحتملة بسرعة. ومع ذلك، فقد كافحت الأساليب الآلية التقليدية في إنتاج استراتيجيات هجوم متنوعة وناجحة.

    يقدم بحث OpenAI “الفريق الأحمر المتنوع والفعال مع المكافآت التي يتم إنشاؤها تلقائيًا والتعلم المعزز متعدد الخطوات”، وهي طريقة تشجع على المزيد من التنوع في استراتيجيات الهجوم مع الحفاظ على الفعالية.

    تتضمن هذه الطريقة استخدام الذكاء الاصطناعي لإنشاء سيناريوهات مختلفة، مثل النصائح غير المشروعة، وتدريب نماذج الفريق الأحمر لتقييم هذه السيناريوهات بشكل نقدي. تكافئ هذه العملية التنوع والفعالية، وتعزز تقييمات السلامة الأكثر تنوعًا وشمولاً.

    على الرغم من فوائده، فإن الفريق الأحمر له حدود. فهو يلتقط المخاطر في وقت محدد، والتي قد تتطور مع تطور نماذج الذكاء الاصطناعي. بالإضافة إلى ذلك، يمكن لعملية الفريق الأحمر أن تخلق عن غير قصد مخاطر معلوماتية، مما قد ينبه الجهات الفاعلة الضارة إلى نقاط الضعف غير المعروفة على نطاق واسع بعد. تتطلب إدارة هذه المخاطر بروتوكولات صارمة وإفصاحات مسؤولة.

    في حين أن الفريق الأحمر لا يزال يلعب دورًا محوريًا في اكتشاف المخاطر وتقييمها، فإن OpenAI تعترف بضرورة دمج وجهات نظر عامة أوسع حول السلوكيات والسياسات المثالية للذكاء الاصطناعي لضمان توافق التكنولوجيا مع القيم والتوقعات المجتمعية.

    أنظر أيضا: يقدم الاتحاد الأوروبي مسودة إرشادات تنظيمية لنماذج الذكاء الاصطناعي

    هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الضخمة من قادة الصناعة؟ اطلع على معرض الذكاء الاصطناعي والبيانات الضخمة الذي يقام في أمستردام وكاليفورنيا ولندن. ويقام هذا الحدث الشامل في موقع مشترك مع أحداث رائدة أخرى بما في ذلك مؤتمر الأتمتة الذكية، وBlockX، وأسبوع التحول الرقمي، ومعرض الأمن السيبراني والسحابي.

    استكشف الأحداث والندوات عبر الإنترنت القادمة الأخرى المتعلقة بتكنولوجيا المؤسسات والمدعومة من TechForge هنا.

    العلامات: الذكاء الاصطناعي، الذكاء الاصطناعي، التطوير، الأخلاق، أوبيناي، الفريق الأحمر، السلامة، المجتمع

    شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr البريد الإلكتروني
    السابقانظر إلى هذا BIOS اللعين لهذه اللوحة الأم اللعينة
    التالي قد لا تكون ترقية Siri التي تنتظرها جاهزة حتى عام 2026

    المقالات ذات الصلة

    الذكاء الإصطناعي

    AI blockchain: ما هو حقا؟

    10 يونيو, 2025
    الذكاء الإصطناعي

    لماذا اختار Openai كوريا الجنوبية للتوسع العالمي؟

    10 يونيو, 2025
    الذكاء الإصطناعي

    الطلب على رقائق الذكاء الاصطناعى “تفوق العرض” في سنة قياسية

    10 يونيو, 2025
    الذكاء الإصطناعي

    Reddit يقود أنثروبور لتجنب بيانات المستخدم لتدريب الذكاء الاصطناعي

    10 يونيو, 2025
    الذكاء الإصطناعي

    تفتح Apple نموذج AI الأساسي للمطورين وسط استراتيجية WWDC المقاس

    10 يونيو, 2025
    الذكاء الإصطناعي

    المملكة المتحدة تعالج فجوة مهارات الذكاء الاصطناعي من خلال شراكة Nvidia

    9 يونيو, 2025
    الذكاء الإصطناعي

    يطلق الأنثروبور نماذج كلود AI للأمن القومي الأمريكي

    6 يونيو, 2025
    الذكاء الإصطناعي

    Reddit يقاضي الأنثروبور على تجريف بيانات الذكاء الاصطناعي

    5 يونيو, 2025
    الذكاء الإصطناعي

    منظمة العفو الدولية تنشر الأمن والحوكمة ، مع Deloitte

    4 يونيو, 2025
    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    Demo
    اخر الاخبار

    كيفية تسجيل مقاطع فيديو محمية بدون شاشة سوداء

    31 يوليو, 2024879 زيارة

    سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

    4 يوليو, 2024695 زيارة

    كل ما تريد معرفته عن Reacher الموسم الثالث

    6 مايو, 2024677 زيارة

    Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

    2 أبريل, 2024647 زيارة

    4 مزايا بطاريات السيليكون الكربونية للهواتف الذكية

    7 مارس, 2024486 زيارة
    رائج الآن
    اخر الاخبار

    يحصل iPhone على أول تطبيق إباحي أصلي له

    فريق التحرير4 فبراير, 2025
    اخر الاخبار

    هل يستمع هاتفك سراً؟ إليك طريقة بسيطة لمعرفة ذلك

    فريق التحرير13 أبريل, 2025
    اخر الاخبار

    تعامل مع محاسبة عملك مثل Pro – interuit QuickBooks الآن أكثر من 60 ٪

    فريق التحرير3 يونيو, 2025
    رائج الآن

    يحصل iPhone على أول تطبيق إباحي أصلي له

    4 فبراير, 202511 زيارة

    هل يستمع هاتفك سراً؟ إليك طريقة بسيطة لمعرفة ذلك

    13 أبريل, 202510 زيارة

    تعامل مع محاسبة عملك مثل Pro – interuit QuickBooks الآن أكثر من 60 ٪

    3 يونيو, 20255 زيارة
    اختيارات المحرر

    محادثات مدير “كيفية تدريب التنين الخاص بك” يعزز قوس جيرارد بتلر

    11 يونيو, 2025

    هذه بطاقة الرسومات RTX 5070 المعدلة تخفي جهاز كمبيوتر مصغر كامل داخل

    11 يونيو, 2025

    الكشف عن متطلبات تشغيل Jurassic World Evolution 3 على الحاسب الشخصي

    11 يونيو, 2025
    تقنية نيوز
    فيسبوك X (Twitter) الانستغرام يوتيوب لينكدإن تيكتوك
    • الرئيسية
    • سياسة الخصوصية
    • من نحن
    • اتصل بنا
    © 2025 تقنية نيوز. جميع حقوق النشر محفوظة.

    اكتب كلمة البحث ثم اضغط على زر Enter