Close Menu
تقنية نيوزتقنية نيوز
    مقالات قد تهمك

    البث المباشر الفرنسية النهائية المفتوحة

    8 يونيو, 2025

    هذان المجموعتان المجرة على وشك أن تحطم بعضهما البعض –

    8 يونيو, 2025

    قـصـة | Rockstar: أسطورة صنعت مجد الألعاب الحديثة

    8 يونيو, 2025
    فيسبوك X (Twitter) الانستغرام
    • من نحن
    • سياسة الخصوصية
    • اتصل بنا
    فيسبوك X (Twitter) الانستغرام يوتيوب
    تقنية نيوزتقنية نيوز
    • الرئيسية
    • اخر الاخبار
    • هواتف ذكية
    • كمبيوتر
    • برامج وتطبيقات
    • شركات
      • ابل
      • سامسونج
      • جوجل
      • مايكروسوفت
      • أمازون
    • المزيد
      • الذكاء الإصطناعي
      • الأمن الإلكتروني
      • ألعاب
      • منوعات تقنية
    اشترك معنا
    تقنية نيوزتقنية نيوز
    الرئيسية » أنثروبيك تطور تقنية ثورية لمنع إساءة استخدام نماذج الذكاء الاصطناعي
    منوعات تقنية

    أنثروبيك تطور تقنية ثورية لمنع إساءة استخدام نماذج الذكاء الاصطناعي

    فريق التحريربواسطة فريق التحرير4 فبراير, 20250 زيارةلا توجد تعليقات
    شاركها فيسبوك تويتر بينتيريست لينكدإن Tumblr رديت تيلقرام البريد الإلكتروني
    شاركها
    فيسبوك تويتر لينكدإن بينتيريست البريد الإلكتروني

    كشفت شركة أنثروبيك الناشئة في مجال الذكاء الاصطناعي عن تقنية جديدة تهدف إلى منع المستخدمين من إساءة استخدام نماذجها، واستخراج محتوى ضار منها، في خطوة تعكس تسابق كبرى الشركات التقنية لتعزيز معايير الأمان في هذا المجال المتطور.

    وأوضحت الشركة في ورقة بحثية أنها طوّرت نظامًا جديدًا يُعرف باسم “المُصنّفات الدستورية”، وهو طبقة حماية تعمل فوق نماذج اللغة الكبيرة، مثل نموذج Claude التابع لها، ويتيح هذا النظام مراقبة المدخلات والمخرجات، لمنع إنتاج أي محتوى غير آمن.

    ويأتي هذا التطوير في ظل تصاعد المخاوف بشأن ما يُعرف بـ “اختراق الذكاء الاصطناعي Jailbreaking”، وهي محاولات لاستغلال النماذج لتوليد معلومات غير قانونية أو خطِرة، مثل تعليمات تصنيع الأسلحة الكيميائية. ومع تزايد هذه التهديدات، تتسابق الشركات لإيجاد حلول تحمي نماذجها، مما يساعدها في تجنب التدقيق التنظيمي، وكسب ثقة المؤسسات.

    وقد طرحت مايكروسوفت بالفعل تقنية “الدروع التوجيهية Prompt Shields” في مارس الماضي، في حين أطلقت ميتا نموذج “حارس التوجيه Prompt Guard” في يوليو من عام 2023، الذي تعرض للاختراق في البداية، لكنه خضع لاحقًا لتحسينات أمنية.

    وقال مرينانك شارما، أحد أعضاء الفريق التقني في أنثروبيك: “إن الدافع الرئيسي وراء تطوير النظام كان التعامل مع الأخطار الشديدة، مثل تصنيع الأسلحة الكيميائية، ولكن الميزة الأهم هي القدرة على التكيف والاستجابة السريعة”.

    ومع أن أنثروبيك لم تدمج هذه التقنية في نماذج Claude الحالية، فإنها أشارت إلى احتمال استخدامها مستقبلًا عند إطلاق نماذج أكثر تطورًا وأعلى خطورة.

    ويعتمد النظام الجديد على “دستور” من القواعد التي تحدد المحتوى المسموح والمحظور، ويمكن تعديله للتعامل مع أنواع مختلفة من المواد الخطِرة. وتُستخدم طرق متنوعة لاختراق النماذج، مثل إعادة صياغة الطلبات بأسلوب غير مألوف، أو مطالبة النموذج بالتصرف كشخصية خيالية لتجاوز قيود الأمان.

    ولضمان فاعلية النظام، قدمت أنثروبيك مكافآت تصل إلى 15,000 دولار للباحثين الأمنيين الذين تمكنوا من اختراق النموذج في إطار برنامج “مكافآت اكتشاف الثغرات Bug Bounty”.

    ووفقًا لنتائج الاختبارات، فقد نجح نموذج Claude 3.5 Sonnet في رفض أكثر من 95% من محاولات الاختراق عند تشغيل التقنية الأمنية الجديدة، مقارنةً بنسبة قدرها 14% فقط عند عدم تفعيلها.

    وتحاول شركات الذكاء الاصطناعي تحقيق توازن بين الأمان وكفاءة النماذج، إذ تؤدي إجراءات المراقبة الصارمة أحيانًا إلى رفض الطلبات المشروعة. وقد شهدت نماذج مثل Gemini و Llama 2 مشكلات في هذا الجانب عند إطلاقها الأولي، لكن أنثروبيك أكدت أن نظامها أدى إلى زيادة طفيفة فقط في معدلات الرفض غير الضرورية.

    وتأتي إضافة هذه الطبقة الأمنية بتكلفة تشغيلية إضافية، إذ أشارت الشركة إلى أن تشغيلها يزيد استهلاك الموارد الحاسوبية بنسبة قدرها 24%، وهو ما يشكّل تحديًا في ظل ارتفاع تكاليف تشغيل نماذج الذكاء الاصطناعي.

    تم نسخ الرابط

    شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr البريد الإلكتروني
    السابقلن تظل كاميرا Google Nest Security Camera ذات الأضواء الكاشفة رخيصة لفترة طويلة في الأسعار منذ شهور
    التالي تقرير.. آيفون 15 الهاتف الأكثر مبيعًا في عام 2024

    المقالات ذات الصلة

    منوعات تقنية

    جوجل تطوّر Gemini بميزة “الإجراءات المجدولة” لتنفيذ المهام تلقائيًا

    8 يونيو, 2025
    منوعات تقنية

    أمازون تختبر روبوتات بشرية لتوصيل الطلبات استعدادًا لتجارب واقعية

    6 يونيو, 2025
    منوعات تقنية

    ChatGPT يضيف تكاملًا مع جوجل درايف ودروب بوكس

    5 يونيو, 2025
    منوعات تقنية

    كيفية تحقيق أقصى استفادة من تطبيق جوجل NotebookLM المدعوم بالذكاء الاصطناعي 

    4 يونيو, 2025
    منوعات تقنية

    كيف تسهل تقنيات الذكاء الاصطناعي رحلة ضيوف الرحمن في موسم الحج؟

    4 يونيو, 2025
    منوعات تقنية

    “بصير”.. منصة ذكية لتعزيز الأمن والسلامة وإدارة الحشود في موسم الحج 

    4 يونيو, 2025
    منوعات تقنية

    موسم الحج 2025.. مستشفى “صحة الافتراضي” يقدم رعاية صحية رقمية متطورة للحجاج

    4 يونيو, 2025
    منوعات تقنية

    كيف يعيد الذكاء الاصطناعي تشكيل مستقبل الإبداع البشري؟

    4 يونيو, 2025
    منوعات تقنية

    ميتا تُوقّع اتفاقًا لدخول مجال الطاقة النووية

    4 يونيو, 2025
    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    Demo
    اخر الاخبار

    كيفية تسجيل مقاطع فيديو محمية بدون شاشة سوداء

    31 يوليو, 2024876 زيارة

    سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

    4 يوليو, 2024694 زيارة

    كل ما تريد معرفته عن Reacher الموسم الثالث

    6 مايو, 2024677 زيارة

    Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

    2 أبريل, 2024646 زيارة

    4 مزايا بطاريات السيليكون الكربونية للهواتف الذكية

    7 مارس, 2024485 زيارة
    رائج الآن
    اخر الاخبار

    يحصل iPhone على أول تطبيق إباحي أصلي له

    فريق التحرير4 فبراير, 2025
    اخر الاخبار

    هل يستمع هاتفك سراً؟ إليك طريقة بسيطة لمعرفة ذلك

    فريق التحرير13 أبريل, 2025
    هواتف ذكية

    Samsung Galaxy Z Fold 6 مقابل Z Fold 5: ما هو المختلف فعليًا؟

    فريق التحرير12 يوليو, 2024
    رائج الآن

    يحصل iPhone على أول تطبيق إباحي أصلي له

    4 فبراير, 202520 زيارة

    هل يستمع هاتفك سراً؟ إليك طريقة بسيطة لمعرفة ذلك

    13 أبريل, 20257 زيارة

    Samsung Galaxy Z Fold 6 مقابل Z Fold 5: ما هو المختلف فعليًا؟

    12 يوليو, 20245 زيارة
    اختيارات المحرر

    البث المباشر الفرنسية النهائية المفتوحة

    8 يونيو, 2025

    هذان المجموعتان المجرة على وشك أن تحطم بعضهما البعض –

    8 يونيو, 2025

    قـصـة | Rockstar: أسطورة صنعت مجد الألعاب الحديثة

    8 يونيو, 2025
    تقنية نيوز
    فيسبوك X (Twitter) الانستغرام يوتيوب لينكدإن تيكتوك
    • الرئيسية
    • سياسة الخصوصية
    • من نحن
    • اتصل بنا
    © 2025 تقنية نيوز. جميع حقوق النشر محفوظة.

    اكتب كلمة البحث ثم اضغط على زر Enter