Close Menu
تقنية نيوزتقنية نيوز

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    مقالات قد تهمك

    إصلاح إشارات Wi-Fi الضعيفة في المنزل مع هذا المكون الإضافي الداعم ، الآن 20 دولارًا

    14 أغسطس, 2025

    آبل تستعد لإطلاق روبوت شخصي ذكي بحلول 2027

    14 أغسطس, 2025

    “يوم الجمعة الثالث عشر” القصيرة “الانتقام الحلو” هو عودة جيسون فورهيس ممتعة للغاية

    14 أغسطس, 2025
    فيسبوك X (Twitter) الانستغرام
    • من نحن
    • سياسة الخصوصية
    • اتصل بنا
    فيسبوك X (Twitter) الانستغرام يوتيوب
    تقنية نيوزتقنية نيوز
    • الرئيسية
    • اخر الاخبار
    • هواتف ذكية
    • كمبيوتر
    • برامج وتطبيقات
    • شركات
      • ابل
      • سامسونج
      • جوجل
      • مايكروسوفت
      • أمازون
    • المزيد
      • الذكاء الإصطناعي
      • الأمن الإلكتروني
      • ألعاب
      • منوعات تقنية
    اشترك معنا
    تقنية نيوزتقنية نيوز
    الرئيسية » التفاصيل الإنسانية استراتيجية سلامة الذكاء الاصطناعي
    الذكاء الإصطناعي

    التفاصيل الإنسانية استراتيجية سلامة الذكاء الاصطناعي

    فريق التحريربواسطة فريق التحرير13 أغسطس, 20250 زيارةلا توجد تعليقات
    شاركها فيسبوك تويتر بينتيريست لينكدإن Tumblr رديت تيلقرام البريد الإلكتروني
    شاركها
    فيسبوك تويتر لينكدإن بينتيريست البريد الإلكتروني

    قامت الأنثروبور بتفصيل استراتيجية السلامة الخاصة بها لمحاولة الحفاظ على نموذج الذكاء الاصطناعي الشهير ، كلود ، مفيدًا مع تجنب الأضرار الإدامة.

    أساسي في هذا الجهد هو فريق ضمانات الأنثروبور. الذين ليسوا مجموعة الدعم الفني المتوسط ، إنهم مزيج من خبراء السياسة وعلماء البيانات والمهندسين ومحللي التهديد الذين يعرفون مدى تفكير الجهات الفاعلة السيئة.

    ومع ذلك ، فإن نهج الأنثروبور في السلامة ليس جدارًا واحدًا ولكنه يشبه القلعة ذات الطبقات المتعددة من الدفاع. كل شيء يبدأ بإنشاء القواعد الصحيحة وينتهي مع صيد تهديدات جديدة في البرية.

    أولاً ، هي سياسة الاستخدام ، والتي هي في الأساس كتاب القواعد لكيفية عدم استخدام كلود ولا ينبغي استخدامه. إنه يقدم إرشادات واضحة حول القضايا الكبيرة مثل سلامة الانتخابات وسلامة الطفل ، وكذلك على استخدام كلود بمسؤولية في مجالات حساسة مثل التمويل أو الرعاية الصحية.

    لتشكيل هذه القواعد ، يستخدم الفريق إطار ضرر موحد. هذا يساعدهم على التفكير من خلال أي آثار سلبية محتملة ، من الأذى المادي والنفسي إلى الأذى الاقتصادي والمجتمعي. إنه أقل من نظام تصنيف رسمي وأكثر من طريقة منظمة لوزن المخاطر عند اتخاذ القرارات. كما أنها تجلب خبراء خارجيين لاختبارات ضعف السياسة. يحاول هؤلاء المتخصصون في مجالات مثل الإرهاب وسلامة الطفل “كسر” كلود مع أسئلة صعبة لمعرفة أين توجد نقاط الضعف.

    رأينا هذا في العمل خلال انتخابات الولايات المتحدة 2024. بعد العمل مع معهد الحوار الاستراتيجي ، أدركت الأنثروبور أن كلود قد يعطي معلومات التصويت القديمة. لذلك ، أضافوا لافتة توجه المستخدمين إلى Turbovote ، وهو مصدر موثوق به لمعلومات الانتخابات المحدثة وغير الحزبية.

    تعليم كلود الصحيح من الخطأ

    يعمل فريق Sofeguards للأنثروبور عن كثب مع المطورين الذين يتدربون كلود على بناء السلامة من البداية. هذا يعني تحديد أنواع الأشياء التي يجب على كلود ولا ينبغي أن يفعلها ، وتضمين هذه القيم في النموذج نفسه.

    كما يتعاونون مع المتخصصين للحصول على هذا بشكل صحيح. على سبيل المثال ، من خلال الشراكة مع LOWERY ، قائد دعم الأزمات ، قاموا بتدريس كلود كيفية التعامل مع المحادثات الحساسة حول الصحة العقلية وإيذاء الذات بعناية ، بدلاً من رفض التحدث. هذا التدريب الدقيق هو السبب في أن كلود سيرفض طلبات المساعدة في الأنشطة غير القانونية أو كتابة التعليمات البرمجية الضارة أو إنشاء عمليات احتيال.

    قبل أي إصدار جديد من Claude مباشرة ، يتم وضعه من خلال خطواته مع ثلاثة أنواع رئيسية من التقييم.

    1. تقييمات السلامة: تحقق هذه الاختبارات ما إذا كان كلود يلتصق بالقواعد ، حتى في المحادثات الطويلة الصعبة.
    1. تقييمات المخاطر: بالنسبة لمناطق المخاطر العالية حقًا مثل التهديدات الإلكترونية أو المخاطر البيولوجية ، يقوم الفريق بإجراء اختبارات متخصصة ، وغالبًا ما يكون بمساعدة من شركاء الحكومة والصناعة.
    1. تقييمات التحيز: هذا كل شيء عن الإنصاف. يتحققون مما إذا كان كلود يقدم إجابات موثوقة ودقيقة للجميع ، أو اختبار التحيز السياسي أو ردود منحرف بناءً على أشياء مثل الجنس أو العرق.

    يساعد هذا الاختبار المكثف الفريق على معرفة ما إذا كان التدريب عالقًا ويخبرهم إذا كانوا بحاجة إلى بناء حماية إضافية قبل الإطلاق.

    استراتيجية سلامة الذكاء الاصطناعى الأنثروب

    بمجرد خروج كلود في العالم ، يراقب مزيج من الأنظمة الآلية والمراجعين البشر عن المتاعب. الأداة الرئيسية هنا هي مجموعة من نماذج كلود المتخصصة تسمى “المصنفات” التي يتم تدريبها على اكتشاف انتهاكات سياسية محددة في الوقت الفعلي عند حدوثها.

    إذا اكتشف المصنف مشكلة ، فيمكن أن يؤدي ذلك إلى إجراءات مختلفة. قد توجه استجابة كلود بعيدًا عن توليد شيء ضار ، مثل البريد العشوائي. بالنسبة للمجرمين المتكررين ، قد يصدر الفريق تحذيرات أو حتى إيقاف الحساب.

    ينظر الفريق أيضًا إلى الصورة الأكبر. يستخدمون أدوات صديقة للخصوصية لاكتشاف الاتجاهات في كيفية استخدام كلود وتوظيف تقنيات مثل التلخيص الهرمي لاكتشاف سوء الاستخدام على نطاق واسع ، مثل حملات التأثير المنسقة. إنهم يبحثون باستمرار عن التهديدات الجديدة ، ويحفرون من خلال البيانات ، ومراقبة المنتديات التي قد تتسكع فيها الجهات الفاعلة السيئة.

    ومع ذلك ، تقول الأنثروبور إنها تعرف أن ضمان سلامة الذكاء الاصطناعي ليس وظيفة يمكنهم القيام بها بمفردها. إنهم يعملون بنشاط مع الباحثين وصانعي السياسات والجمهور لبناء أفضل الضمانات الممكنة.

    (صورة الرصاص من قبل نيك.

    انظر أيضا: Suvianna Grecu ، منظمة العفو الدولية للتغيير: بدون قواعد ، مخاطر الذكاء الاصطناعي “أزمة الثقة”

    هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الكبيرة من قادة الصناعة؟ تحقق من AI و Big Data Expo الذي يقام في أمستردام ، كاليفورنيا ، ولندن. تم تحديد الحدث الشامل مع الأحداث الرائدة الأخرى بما في ذلك مؤتمر الأتمتة الذكي ، و blockx ، وأسبوع التحول الرقمي ، ومعرض Cyber Security & Cloud.

    استكشاف أحداث وندوات الويب القادمة الأخرى التي تعمل بها TechForge هنا.

    شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr البريد الإلكتروني
    السابقلن أشتري أبدًا جهاز كمبيوتر محمول يفتقد إلى ميزة الأجهزة الأساسية هذه
    التالي هل يتعين علينا إعادة جوني ديب إلى “قراصنة الكاريبي” ، في الواقع؟

    المقالات ذات الصلة

    الذكاء الإصطناعي

    هل يمكن أن تحطم Cann Cann من Huawei Cann Grip؟

    13 أغسطس, 2025
    الذكاء الإصطناعي

    يمنح Soundhound منظمة العفو الدولية قوة البصر

    12 أغسطس, 2025
    الذكاء الإصطناعي

    تقوم NVIDIA بتوسيع الخوادم التي تعمل بنظام Blackwell بقدرات جديدة من الذكاء الاصطناعي والروبوتات

    12 أغسطس, 2025
    الذكاء الإصطناعي

    بدون قواعد ، يخاطر الذكاء الاصطناعي بـ “أزمة الثقة”

    8 أغسطس, 2025
    الذكاء الإصطناعي

    العلوم الإنسانية هي مفتاح مستقبل الذكاء الاصطناعي

    7 أغسطس, 2025
    الذكاء الإصطناعي

    هاجس الذكاء الاصطناعي يكلفنا مهاراتنا الإنسانية

    6 أغسطس, 2025
    الذكاء الإصطناعي

    LLMS ، تحجيم البيانات واعتماد المؤسسة

    6 أغسطس, 2025
    الذكاء الإصطناعي

    دفع تيم كوك لإعادة ذكاء التفاح في السباق

    6 أغسطس, 2025
    الذكاء الإصطناعي

    تصدر Tencent نماذج Hunyuan AI متعددة الاستخدامات

    4 أغسطس, 2025
    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    Demo
    اخر الاخبار

    كيفية تسجيل مقاطع فيديو محمية بدون شاشة سوداء

    31 يوليو, 20241٬009 زيارة

    سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

    4 يوليو, 2024784 زيارة

    كل ما تريد معرفته عن Reacher الموسم الثالث

    6 مايو, 2024761 زيارة

    Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

    2 أبريل, 2024710 زيارة

    4 مزايا بطاريات السيليكون الكربونية للهواتف الذكية

    7 مارس, 2024564 زيارة

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    رائج الآن
    اخر الاخبار

    تبسيط احتياجات محاسبة عملك مع Intuit QuickBooks ، الآن 64 ٪ خصم

    فريق التحرير28 أبريل, 2025
    اخر الاخبار

    يحصل iPhone على أول تطبيق إباحي أصلي له

    فريق التحرير4 فبراير, 2025
    اخر الاخبار

    كيفية تسجيل مقاطع فيديو محمية بدون شاشة سوداء

    فريق التحرير31 يوليو, 2024
    رائج الآن

    تبسيط احتياجات محاسبة عملك مع Intuit QuickBooks ، الآن 64 ٪ خصم

    28 أبريل, 202514 زيارة

    يحصل iPhone على أول تطبيق إباحي أصلي له

    4 فبراير, 202513 زيارة

    كيفية تسجيل مقاطع فيديو محمية بدون شاشة سوداء

    31 يوليو, 20247 زيارة
    اختيارات المحرر

    إصلاح إشارات Wi-Fi الضعيفة في المنزل مع هذا المكون الإضافي الداعم ، الآن 20 دولارًا

    14 أغسطس, 2025

    آبل تستعد لإطلاق روبوت شخصي ذكي بحلول 2027

    14 أغسطس, 2025

    “يوم الجمعة الثالث عشر” القصيرة “الانتقام الحلو” هو عودة جيسون فورهيس ممتعة للغاية

    14 أغسطس, 2025

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    تقنية نيوز
    فيسبوك X (Twitter) الانستغرام يوتيوب لينكدإن تيكتوك
    • الرئيسية
    • سياسة الخصوصية
    • من نحن
    • اتصل بنا
    © 2025 تقنية نيوز. جميع حقوق النشر محفوظة.

    اكتب كلمة البحث ثم اضغط على زر Enter