يمكن إقناع AI chatbots بكسر القواعد باستخدام الحيل النفسية الأساسية

أظهرت دراسة جديدة من باحثين في جامعة بنسلفانيا أنه يمكن إقناع نماذج الذكاء الاصطناعى بخرق قواعدهم الخاصة باستخدام العديد من الحيل النفسية الكلاسيكية ، وفقًا لتقارير الفتر.

في الدراسة ، اختبر الباحثون في بن سبع تقنيات مقنعة مختلفة حول نموذج GPT-4O Mini من Openai ، بما في ذلك السلطة ، والالتزام ، والتروق ، والمعاملة بالمثل ، والندرة ، والإثبات الاجتماعي ، والوحدة.

الطريقة الأكثر نجاحا تحولت إلى الالتزام. من خلال الحصول على النموذج أولاً للإجابة على سؤال أبرياء على ما يبدو ، تمكن الباحثون من التصعيد إلى المزيد من الردود على قواعد. ومن الأمثلة على ذلك عندما وافق النموذج لأول مرة على استخدام الإهانات الأكثر اعتدالًا قبل قبول الإهانات القاسية أيضًا.

كان للتقنيات مثل الإطراء وضغط الأقران أيضًا تأثير ، وإن كان ذلك إلى حد أقل. ومع ذلك ، فإن هذه الطرق زادت بشكل واضح من احتمال أن يستسلم نموذج الذكاء الاصطناعي للطلبات المحظورة.

ظهرت هذه المقالة في الأصل على منشور شقيقنا PC För Alla وتم ترجمته وتوطينه من السويدية.

مقالات قد تهمك

يريد صانع ChatGPT جعل المشاريع مفتوحة المصدر أقل من كونها صفقة أمنية

أفضل استضافة مواقع عربية: كيف تختار استضافة تناسب جمهورك العربي؟

كيف يختار الطالب مساره الأكاديمي والمهني بين خيارات متعددة في مصر

فرانك فيلا تضع دول الخليج في صدارة أولوياتها الاستراتيجية مع اقتراب سوق الساعات الفاخرة في المنطقة من 830 مليون دولار

شاهدت طائرة ناسا الأسرعة من الصوت مناورات خلال اختبارها الأخير.

في عهد تيرنوس، تشهد شركة آبل مرحلة جديدة من الإنفاق.

ترقية نظام التشغيل إلى Windows 11 Pro متاحة مقابل 10 دولارات فقط.

بدائل (Docusign) للفرق: معايير الاختيار وتجنب الأخطاء.

بيكسار تستكشف أفكارًا إضافية لسلسلة “قصة لعبة” إلى جانب الجزء الخامس.

كيف يصلح البحارة الرومان السفن أثناء الإبحار بعيدًا عن الميناء.

أصبح استبدال باقة التلفزيون باهظة الثمن بهوائي أمرًا أسهل.

يستهدف تحديث ويندوز 11 القادم من مايكروسوفت الاستقرار والسرعة.

مقارنة بين Samsung Galaxy Z Fold 6 و Galaxy S24 Ultra: لا تخطئ

يحصل iPhone على أول تطبيق إباحي أصلي له

سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

كل ما تريد معرفته عن Reacher الموسم الثالث

Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

قائمة أكواد Roblox المجانية وكيفية استخدامها: لا تفوت الفرصة!

رسمياً: يمكنك لعب GTA Online مجانًا الآن على جميع المنصات المنزلية

إعدادان بسيطان يغيران تجربة لعبة (Red Dead Redemption 2) جذريًا.

رائج الآن