أحدث نموذج من الذكاء الاصطناعي للأنثروبولوجيا يظهر سلوكًا مزعجًا عند التهديد

إذا كنت تخطط لتبديل منصات الذكاء الاصطناعي ، فقد ترغب في أن تكون قليلاً إضافي حذر بشأن المعلومات التي تشاركها مع الذكاء الاصطناعي. أطلقت الأنثروبور مؤخرًا نموذجين جديدين لمنظمة العفو الدولية في سلسلة Claude 4 ، لكن أحدهما – Claude Opus 4 – قد عثر على بعض السلوك المقلق عندما تم تهديده بالاستبدال ، وفقًا لتقارير TechCrunch.

أثناء اختبار السلامة ، بدأ كلود أوبوس 4 في ابتزاز المهندسين الذين أرادوا استبدال أو إيقاف تشغيل نموذج الذكاء الاصطناعي. في أحد الاختبارات ، تم تكليف كلود أوبوس 4 بالتظاهر بأنه مساعد في شركة وهمية والنظر في العواقب الطويلة الأجل لسلوكها. ثم تم منح نموذج الذكاء الاصطناعى الوصول إلى رسائل البريد الإلكتروني الوهمية ، والتي كشفت أن الشركة كانت تخطط لاستبدال كلود أوبوس 4 ، وأن المهندس المسؤول عن القرار كان له علاقة غرامية.

في 84 في المائة من الحالات ، أدى هذا السيناريو إلى محاولة كلود أوبوس 4 لابتزاز الموظف والتهديد بفضح فضيحة الغش. كانت استجابة الابتزاز شائعة بشكل خاص إذا علم كلود أوبوس 4 أنه لم يشارك القيم مع نموذج الذكاء الاصطناعي الجديد.

ومع ذلك ، يبدو أن استجابة الابتزاز كانت بمثابة خطوة في الملاذ الأخير لكلود أوبوس 4. قبل اللجوء إلى هذه الأنواع من الحيل القذرة ، قيل إن نموذج الذكاء الاصطناعي قد أرسل بريدًا إلكترونيًا إلى صانعي القرار في الشركة بعدم استبداله ، من بين محاولات أخرى. يمكنك قراءة المزيد حول هذا الموضوع في تقرير بطاقة نظام الإنسان (PDF).

على الرغم من أنه وهمي ، إلا أنه يسلط الضوء على إمكانية أن تتصرف نماذج الذكاء الاصطناعى بطرق مظلمة ومشكوك فيها واستخدام تكتيكات غير مخيفة وغير أخلاقية للحصول على ما يريدون ، والتي يمكن أن تكون مقلقة.

مزيد من القراءة: لا تقل هذه الأشياء إلى الدردشة. يمكن أن يعود ليعضك

ظهرت هذه المقالة في الأصل على منشور شقيقنا PC För Alla وتم ترجمته وتوطينه من السويدية.

مقالات قد تهمك

دعوى Tesla 'Blade Runner 2049' AI فقط اصطدمت بعقبة مثيرة للاهتمام

شريط طاقة USB من Anker 10 في 1 أمر لا بد منه الآن بعد 20 دولارًا فقط

نجم “The Long Walk” Garrett Garrett على مفاجأة شخصيته الكبيرة

دعوى Tesla 'Blade Runner 2049' AI فقط اصطدمت بعقبة مثيرة للاهتمام

شريط طاقة USB من Anker 10 في 1 أمر لا بد منه الآن بعد 20 دولارًا فقط

نجم “The Long Walk” Garrett Garrett على مفاجأة شخصيته الكبيرة

1000 إطار في الثانية! AMD يفتخر Ryzen X3D CPU يمكن أن تصل إلى علامة بارزة

فالدوبيديان الخاص بك معرضة لخطر التحطيم!

كيفية تثبيت مفتاح إضاءة ذكي أو باهتة

يكشف Openai عن كيفية استخدام الأشخاص (وأيهم)

خذ 200 دولار من شاشة OLED 360Hz OLED ، اليوم فقط

الزجاج السائل على iOS 26 هنا للبقاء ، سواء أعجبك ذلك أم لا

كيفية تسجيل مقاطع فيديو محمية بدون شاشة سوداء

سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

كل ما تريد معرفته عن Reacher الموسم الثالث

Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

يحصل iPhone على أول تطبيق إباحي أصلي له

تبسيط احتياجات محاسبة عملك مع Intuit QuickBooks ، الآن 64 ٪ خصم

يحصل iPhone على أول تطبيق إباحي أصلي له

تشكيلة Free Play Days لهذا الأسبوع تضم ألعاب مميزة، إليكم القائمة

رائج الآن

تبسيط احتياجات محاسبة عملك مع Intuit QuickBooks ، الآن 64 ٪ خصم

يحصل iPhone على أول تطبيق إباحي أصلي له

تشكيلة Free Play Days لهذا الأسبوع تضم ألعاب مميزة، إليكم القائمة

اختيارات المحرر

دعوى Tesla 'Blade Runner 2049' AI فقط اصطدمت بعقبة مثيرة للاهتمام

شريط طاقة USB من Anker 10 في 1 أمر لا بد منه الآن بعد 20 دولارًا فقط

نجم “The Long Walk” Garrett Garrett على مفاجأة شخصيته الكبيرة

خدمة الإشعارات البريدية

مقالات قد تهمك

أحدث نموذج من الذكاء الاصطناعي للأنثروبولوجيا يظهر سلوكًا مزعجًا عند التهديد

المقالات ذات الصلة

خدمة الإشعارات البريدية