Close Menu
تقنية نيوزتقنية نيوز

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    مقالات قد تهمك

    كيفية تسريع هاتف الاندوريد دون برامج؟

    4 أبريل, 2026

    فليب بورد تطلق Surf.. منصة جديدة لتصفح الإنترنت بعيدًا عن الخوارزميات

    3 أبريل, 2026

    بوابة صحية رقمية سورية: هل تتغلب على الازدحام وسرقة البيانات؟

    3 أبريل, 2026
    فيسبوك X (Twitter) الانستغرام
    • من نحن
    • سياسة الخصوصية
    • اتصل بنا
    فيسبوك X (Twitter) الانستغرام يوتيوب
    تقنية نيوزتقنية نيوز
    • الرئيسية
    • اخر الاخبار
    • هواتف ذكية
    • كمبيوتر
    • برامج وتطبيقات
    • شركات
      • ابل
      • سامسونج
      • جوجل
      • مايكروسوفت
      • أمازون
    • المزيد
      • الذكاء الإصطناعي
      • الأمن الإلكتروني
      • ألعاب
      • منوعات تقنية
    اشترك معنا
    تقنية نيوزتقنية نيوز
    الرئيسية » التفاصيل الإنسانية استراتيجية سلامة الذكاء الاصطناعي
    الذكاء الإصطناعي

    التفاصيل الإنسانية استراتيجية سلامة الذكاء الاصطناعي

    فريق التحريربواسطة فريق التحرير13 أغسطس, 20254 زيارةلا توجد تعليقات
    شاركها فيسبوك تويتر بينتيريست لينكدإن Tumblr رديت تيلقرام البريد الإلكتروني
    شاركها
    فيسبوك تويتر لينكدإن بينتيريست البريد الإلكتروني

    قامت الأنثروبور بتفصيل استراتيجية السلامة الخاصة بها لمحاولة الحفاظ على نموذج الذكاء الاصطناعي الشهير ، كلود ، مفيدًا مع تجنب الأضرار الإدامة.

    أساسي في هذا الجهد هو فريق ضمانات الأنثروبور. الذين ليسوا مجموعة الدعم الفني المتوسط ، إنهم مزيج من خبراء السياسة وعلماء البيانات والمهندسين ومحللي التهديد الذين يعرفون مدى تفكير الجهات الفاعلة السيئة.

    ومع ذلك ، فإن نهج الأنثروبور في السلامة ليس جدارًا واحدًا ولكنه يشبه القلعة ذات الطبقات المتعددة من الدفاع. كل شيء يبدأ بإنشاء القواعد الصحيحة وينتهي مع صيد تهديدات جديدة في البرية.

    أولاً ، هي سياسة الاستخدام ، والتي هي في الأساس كتاب القواعد لكيفية عدم استخدام كلود ولا ينبغي استخدامه. إنه يقدم إرشادات واضحة حول القضايا الكبيرة مثل سلامة الانتخابات وسلامة الطفل ، وكذلك على استخدام كلود بمسؤولية في مجالات حساسة مثل التمويل أو الرعاية الصحية.

    لتشكيل هذه القواعد ، يستخدم الفريق إطار ضرر موحد. هذا يساعدهم على التفكير من خلال أي آثار سلبية محتملة ، من الأذى المادي والنفسي إلى الأذى الاقتصادي والمجتمعي. إنه أقل من نظام تصنيف رسمي وأكثر من طريقة منظمة لوزن المخاطر عند اتخاذ القرارات. كما أنها تجلب خبراء خارجيين لاختبارات ضعف السياسة. يحاول هؤلاء المتخصصون في مجالات مثل الإرهاب وسلامة الطفل “كسر” كلود مع أسئلة صعبة لمعرفة أين توجد نقاط الضعف.

    رأينا هذا في العمل خلال انتخابات الولايات المتحدة 2024. بعد العمل مع معهد الحوار الاستراتيجي ، أدركت الأنثروبور أن كلود قد يعطي معلومات التصويت القديمة. لذلك ، أضافوا لافتة توجه المستخدمين إلى Turbovote ، وهو مصدر موثوق به لمعلومات الانتخابات المحدثة وغير الحزبية.

    تعليم كلود الصحيح من الخطأ

    يعمل فريق Sofeguards للأنثروبور عن كثب مع المطورين الذين يتدربون كلود على بناء السلامة من البداية. هذا يعني تحديد أنواع الأشياء التي يجب على كلود ولا ينبغي أن يفعلها ، وتضمين هذه القيم في النموذج نفسه.

    كما يتعاونون مع المتخصصين للحصول على هذا بشكل صحيح. على سبيل المثال ، من خلال الشراكة مع LOWERY ، قائد دعم الأزمات ، قاموا بتدريس كلود كيفية التعامل مع المحادثات الحساسة حول الصحة العقلية وإيذاء الذات بعناية ، بدلاً من رفض التحدث. هذا التدريب الدقيق هو السبب في أن كلود سيرفض طلبات المساعدة في الأنشطة غير القانونية أو كتابة التعليمات البرمجية الضارة أو إنشاء عمليات احتيال.

    قبل أي إصدار جديد من Claude مباشرة ، يتم وضعه من خلال خطواته مع ثلاثة أنواع رئيسية من التقييم.

    1. تقييمات السلامة: تحقق هذه الاختبارات ما إذا كان كلود يلتصق بالقواعد ، حتى في المحادثات الطويلة الصعبة.
    1. تقييمات المخاطر: بالنسبة لمناطق المخاطر العالية حقًا مثل التهديدات الإلكترونية أو المخاطر البيولوجية ، يقوم الفريق بإجراء اختبارات متخصصة ، وغالبًا ما يكون بمساعدة من شركاء الحكومة والصناعة.
    1. تقييمات التحيز: هذا كل شيء عن الإنصاف. يتحققون مما إذا كان كلود يقدم إجابات موثوقة ودقيقة للجميع ، أو اختبار التحيز السياسي أو ردود منحرف بناءً على أشياء مثل الجنس أو العرق.

    يساعد هذا الاختبار المكثف الفريق على معرفة ما إذا كان التدريب عالقًا ويخبرهم إذا كانوا بحاجة إلى بناء حماية إضافية قبل الإطلاق.

    استراتيجية سلامة الذكاء الاصطناعى الأنثروب

    بمجرد خروج كلود في العالم ، يراقب مزيج من الأنظمة الآلية والمراجعين البشر عن المتاعب. الأداة الرئيسية هنا هي مجموعة من نماذج كلود المتخصصة تسمى “المصنفات” التي يتم تدريبها على اكتشاف انتهاكات سياسية محددة في الوقت الفعلي عند حدوثها.

    إذا اكتشف المصنف مشكلة ، فيمكن أن يؤدي ذلك إلى إجراءات مختلفة. قد توجه استجابة كلود بعيدًا عن توليد شيء ضار ، مثل البريد العشوائي. بالنسبة للمجرمين المتكررين ، قد يصدر الفريق تحذيرات أو حتى إيقاف الحساب.

    ينظر الفريق أيضًا إلى الصورة الأكبر. يستخدمون أدوات صديقة للخصوصية لاكتشاف الاتجاهات في كيفية استخدام كلود وتوظيف تقنيات مثل التلخيص الهرمي لاكتشاف سوء الاستخدام على نطاق واسع ، مثل حملات التأثير المنسقة. إنهم يبحثون باستمرار عن التهديدات الجديدة ، ويحفرون من خلال البيانات ، ومراقبة المنتديات التي قد تتسكع فيها الجهات الفاعلة السيئة.

    ومع ذلك ، تقول الأنثروبور إنها تعرف أن ضمان سلامة الذكاء الاصطناعي ليس وظيفة يمكنهم القيام بها بمفردها. إنهم يعملون بنشاط مع الباحثين وصانعي السياسات والجمهور لبناء أفضل الضمانات الممكنة.

    (صورة الرصاص من قبل نيك.

    انظر أيضا: Suvianna Grecu ، منظمة العفو الدولية للتغيير: بدون قواعد ، مخاطر الذكاء الاصطناعي “أزمة الثقة”

    هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الكبيرة من قادة الصناعة؟ تحقق من AI و Big Data Expo الذي يقام في أمستردام ، كاليفورنيا ، ولندن. تم تحديد الحدث الشامل مع الأحداث الرائدة الأخرى بما في ذلك مؤتمر الأتمتة الذكي ، و blockx ، وأسبوع التحول الرقمي ، ومعرض Cyber Security & Cloud.

    استكشاف أحداث وندوات الويب القادمة الأخرى التي تعمل بها TechForge هنا.

    شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr البريد الإلكتروني
    السابقلن أشتري أبدًا جهاز كمبيوتر محمول يفتقد إلى ميزة الأجهزة الأساسية هذه
    التالي هل يتعين علينا إعادة جوني ديب إلى “قراصنة الكاريبي” ، في الواقع؟

    المقالات ذات الصلة

    الذكاء الإصطناعي

    كيفية تسريع هاتف الاندوريد دون برامج؟

    4 أبريل, 2026
    الذكاء الإصطناعي

    شركة CNTXT AI تطلق “منصّت” Munsit، أدق منصة ذكاء اصطناعي صوتي باللغة العربية في العالم، مع تسارع الطلب على خدمات الذكاء الاصطناعي في دولة الإمارات

    2 أبريل, 2026
    الذكاء الإصطناعي

    error code: 524

    2 أبريل, 2026
    الذكاء الإصطناعي

    يواجه كلود تقطير نموذج الذكاء الاصطناعي “على المستوى الصناعي”.

    26 فبراير, 2026
    الذكاء الإصطناعي

    نوكيا وأمازون ويب سيرفيسز تجربان أتمتة الذكاء الاصطناعي لتقطيع شبكات الجيل الخامس (5G).

    25 فبراير, 2026
    الذكاء الإصطناعي

    استكشاف الذكاء الاصطناعي في قطاع البيع بالتجزئة بآسيا والمحيط الهادئ.

    22 فبراير, 2026
    الذكاء الإصطناعي

    كيف تدمج المؤسسات المالية الذكاء الاصطناعي في عمليات اتخاذ القرار.

    19 فبراير, 2026
    الذكاء الإصطناعي

    يكشف (Murder Mystery 2) عن سلوك ناشئ للاعبين عبر الإنترنت.

    15 فبراير, 2026
    الذكاء الإصطناعي

    يستهدف نموذج تنبؤ بالذكاء الاصطناعي تحسين كفاءة موارد الرعاية الصحية.

    15 فبراير, 2026
    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    Demo
    اخر الاخبار

    مقارنة بين Samsung Galaxy Z Fold 6 و Galaxy S24 Ultra: لا تخطئ

    25 يوليو, 20241٬186 زيارة

    يحصل iPhone على أول تطبيق إباحي أصلي له

    4 فبراير, 2025837 زيارة

    سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

    4 يوليو, 2024829 زيارة

    كل ما تريد معرفته عن Reacher الموسم الثالث

    6 مايو, 2024784 زيارة

    Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

    2 أبريل, 2024726 زيارة

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    رائج الآن
    منوعات تقنية

    استخدم chatgpt بالعربي مجانا بدون تسجيل

    فريق التحرير29 مايو, 2025
    الذكاء الإصطناعي

    كيفية تسريع هاتف الاندوريد دون برامج؟

    Hend Ali4 أبريل, 2026
    كمبيوتر

    كيفية تسريع الكمبيوتر واللاب توب.. 12 طريقة لجعل ويندوز أسرع

    فريق التحرير25 أبريل, 2025
    رائج الآن

    استخدم chatgpt بالعربي مجانا بدون تسجيل

    29 مايو, 202510 زيارة

    كيفية تسريع هاتف الاندوريد دون برامج؟

    4 أبريل, 20268 زيارة

    كيفية تسريع الكمبيوتر واللاب توب.. 12 طريقة لجعل ويندوز أسرع

    25 أبريل, 20258 زيارة
    اختيارات المحرر

    كيفية تسريع هاتف الاندوريد دون برامج؟

    4 أبريل, 2026

    فليب بورد تطلق Surf.. منصة جديدة لتصفح الإنترنت بعيدًا عن الخوارزميات

    3 أبريل, 2026

    بوابة صحية رقمية سورية: هل تتغلب على الازدحام وسرقة البيانات؟

    3 أبريل, 2026

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    تقنية نيوز
    فيسبوك X (Twitter) الانستغرام يوتيوب لينكدإن تيكتوك
    • الرئيسية
    • سياسة الخصوصية
    • من نحن
    • اتصل بنا
    © 2026 تقنية نيوز. جميع حقوق النشر محفوظة.

    اكتب كلمة البحث ثم اضغط على زر Enter