Close Menu
تقنية نيوزتقنية نيوز

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    مقالات قد تهمك

    منشئ “Pluribus” فينس جيليجان هو كاره للذكاء الاصطناعي بصوت عالٍ وفخور

    9 نوفمبر, 2025

    لعبة ARC Raiders تخطف الأضواء من الجميع بأكثر من 416 ألف لاعب متزامن!

    9 نوفمبر, 2025

    يخضع فيلم “Dynamic Duo” لمكالمة اختيار الأسبوع المقبل

    9 نوفمبر, 2025
    فيسبوك X (Twitter) الانستغرام
    • من نحن
    • سياسة الخصوصية
    • اتصل بنا
    فيسبوك X (Twitter) الانستغرام يوتيوب
    تقنية نيوزتقنية نيوز
    • الرئيسية
    • اخر الاخبار
    • هواتف ذكية
    • كمبيوتر
    • برامج وتطبيقات
    • شركات
      • ابل
      • سامسونج
      • جوجل
      • مايكروسوفت
      • أمازون
    • المزيد
      • الذكاء الإصطناعي
      • الأمن الإلكتروني
      • ألعاب
      • منوعات تقنية
    اشترك معنا
    تقنية نيوزتقنية نيوز
    الرئيسية » Openai يحفر لماذا تكذب chatbots عن قصد وخداع البشر
    اخر الاخبار

    Openai يحفر لماذا تكذب chatbots عن قصد وخداع البشر

    فريق التحريربواسطة فريق التحرير19 سبتمبر, 20250 زيارةلا توجد تعليقات
    شاركها فيسبوك تويتر بينتيريست لينكدإن Tumblr رديت تيلقرام البريد الإلكتروني
    شاركها
    فيسبوك تويتر لينكدإن بينتيريست البريد الإلكتروني

    في هذه المرحلة ، يعلم معظم الناس أن chatbots قادرة على الاستجابات الهلوسة ، ويشكلون مصادر ، وبصق المعلومات الخاطئة. لكن يمكن أن تكمن chatbots بطرق أكثر تشبه الإنسان ، “التخطيط” لإخفاء أهدافهم الحقيقية وخداع البشر الذين أعطواهم تعليمات. يبدو أن بحثًا جديدًا من Openai و Apollo Research قد اكتشف طرقًا لتخفيض بعض هذه الأكاذيب ، لكن حقيقة أنه يحدث على الإطلاق يجب أن يمنح المستخدمين توقفًا مؤقتًا.

    في صميم القضية مع الذكاء الاصطناعي عن عمد ، يكون المستخدم “اختلالًا” – محددًا على أنه ما يحدث عندما تتبع الذكاء الاصطناعى هدفًا غير مقصود. يقدم الباحثون كمثال على ذلك ، “يمكن أن يتعلم منظمة العفو الدولية كسب المال أن تتعلم السرقة ، في حين أن الهدف المقصود هو كسب المال من الناحية القانونية وأخلاقية فقط”. إن التخطيط هو ما يحدث عندما يحاول النموذج إخفاء حقيقة أنه غير محدد ، ونظرية الباحثين أن النموذج يفعل هذا لحماية نفسه وأهدافه الخاصة. هذا يختلف بالتأكيد عن الهلوسة ، والتي تشير إليها ورقة حديثة نشرتها Openai هي نتيجة لمكافأة النماذج على التخمين أكثر من الاعتراف بعدم اليقين.

    لمعالجة هذه المشكلة ، وضع الباحثون النماذج من خلال ما يسمونه تقنية تدريب مكافحة الخلاص المعروفة باسم “المحاذاة التداولية”. أوضح Openai أن هذه الطريقة ، التي تعمل مع LLMs يمكنها إنتاج آثار “سلسلة الفكرة” التي توضح كيفية عملها من خلال الاستعلامات ، وتعلم مواصفات السلامة النموذجية وتجعلها تفكر في هذه المواصفات قبل الإجابة. من المحتمل أن يكون من المفرط أن يقولوا إنهم أخبروا الآلات بعدم الكذب بشكل أساسي ، ولكن يبدو أنها نسخة أكثر تعقيدًا من ذلك.

    وكانت النتائج إيجابية جدا. وفقًا للباحثين ، لاحظوا انخفاضًا 30x في “الإجراءات السرية” ، أو يحاول إخفاء سلوكيات محددة من المستخدم. عند تطبيقه على نموذج O3 Openai ، قام بتخفيض الإجراءات السرية من 13 ٪ إلى 0.4 ٪ وللأو 4-MINI ، انخفض من 8.7 ٪ إلى 0.3 ٪. (ملاحظة جانبية: اه ، يبدو أن 13 ٪ يشبه التردد العالي جدًا من الخداع من آلة من المفترض أن تتلقى الطلبات.)

    في حين أن هذه الأرقام هي من الواضح أنها تحسن ، إلا أنها ليست صفرًا أيضًا. الشيء هو أن الباحثين لم يكتشفوا كيفية التوقف عن التخطيط تمامًا. وعلى الرغم من أنهم يصرون على أن التخطيط ، من حيث صلته بمعظم استخدامات نماذج الذكاء الاصطناعى ، ليس خطيرًا – فقد يؤدي إلى ، على سبيل المثال ، أن يخبرت ChatGpt للمستخدم بأنها لم تكن مهمة ، على سبيل المثال – لا يمكن أن تزيلها بشكل مستقيم من الكذب. في الواقع ، كتب الباحثون ، “طريقة فشل رئيسية لمحاولة” التدريب “هي ببساطة تعليم النموذج للتخطيط بعناية أكبر وسرية.”

    فهل أصبحت المشكلة أفضل ، أو جعلت النماذج أفضل في إخفاء حقيقة أنهم يحاولون خداع الناس؟ يقول الباحثون إن المشكلة أصبحت أفضل. لن يكذبوا … أليس كذلك؟

    شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr البريد الإلكتروني
    السابقاستدعاء بنك الطاقة في Anker مدعوم الآن من قبل الحكومة
    التالي هواوي تكشف عن Watch Ultimate 2.. ساعة احترافية بميزة التواصل تحت الماء

    المقالات ذات الصلة

    اخر الاخبار

    منشئ “Pluribus” فينس جيليجان هو كاره للذكاء الاصطناعي بصوت عالٍ وفخور

    9 نوفمبر, 2025
    اخر الاخبار

    يخضع فيلم “Dynamic Duo” لمكالمة اختيار الأسبوع المقبل

    9 نوفمبر, 2025
    اخر الاخبار

    كانت المحاكمة الخاطئة لشركة Crypto Bros بمثابة “عبء عاطفي” للمحلفين الذين وصلوا إلى طريق مسدود لدرجة أن “نصفهم” بكى

    9 نوفمبر, 2025
    اخر الاخبار

    ما هي ثلاثية دان تراختنبرغ “المفترس”؟

    8 نوفمبر, 2025
    اخر الاخبار

    تعمل تقنية “Mass Effect 5” الغامضة من BioWare على بناء قصة اللعبة

    8 نوفمبر, 2025
    اخر الاخبار

    تقول الدنمارك إنها ستحظر وسائل التواصل الاجتماعي للمستخدمين الذين تقل أعمارهم عن 15 عامًا

    8 نوفمبر, 2025
    اخر الاخبار

    ها هي العودة الدموية لفيلم “Kill Bill” إلى دور العرض الشهر المقبل

    8 نوفمبر, 2025
    اخر الاخبار

    يسعى أكبر مقاول لشركة ICE إلى الحصول على إيرادات من أجهزة مراقبة الكاحل وسط إغلاق الحكومة

    8 نوفمبر, 2025
    اخر الاخبار

    الحفريات المعاد اكتشافها تعيد رسم خريطة منطقة الماموث الصوفي

    8 نوفمبر, 2025
    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    Demo
    اخر الاخبار

    كيفية تسجيل مقاطع فيديو محمية بدون شاشة سوداء

    31 يوليو, 20241٬083 زيارة

    سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

    4 يوليو, 2024795 زيارة

    كل ما تريد معرفته عن Reacher الموسم الثالث

    6 مايو, 2024768 زيارة

    Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

    2 أبريل, 2024715 زيارة

    يحصل iPhone على أول تطبيق إباحي أصلي له

    4 فبراير, 2025706 زيارة

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    رائج الآن
    منوعات تقنية

    استخدم chatgpt بالعربي مجانا بدون تسجيل

    فريق التحرير29 مايو, 2025
    اخر الاخبار

    يحصل iPhone على أول تطبيق إباحي أصلي له

    فريق التحرير4 فبراير, 2025
    منوعات تقنية

    أقوى بوت تيليجرام تنزيل فيديوهات من مواقع التواصل

    فريق التحرير23 أبريل, 2025
    رائج الآن

    استخدم chatgpt بالعربي مجانا بدون تسجيل

    29 مايو, 202523 زيارة

    يحصل iPhone على أول تطبيق إباحي أصلي له

    4 فبراير, 202515 زيارة

    أقوى بوت تيليجرام تنزيل فيديوهات من مواقع التواصل

    23 أبريل, 202510 زيارة
    اختيارات المحرر

    منشئ “Pluribus” فينس جيليجان هو كاره للذكاء الاصطناعي بصوت عالٍ وفخور

    9 نوفمبر, 2025

    لعبة ARC Raiders تخطف الأضواء من الجميع بأكثر من 416 ألف لاعب متزامن!

    9 نوفمبر, 2025

    يخضع فيلم “Dynamic Duo” لمكالمة اختيار الأسبوع المقبل

    9 نوفمبر, 2025

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    تقنية نيوز
    فيسبوك X (Twitter) الانستغرام يوتيوب لينكدإن تيكتوك
    • الرئيسية
    • سياسة الخصوصية
    • من نحن
    • اتصل بنا
    © 2025 تقنية نيوز. جميع حقوق النشر محفوظة.

    اكتب كلمة البحث ثم اضغط على زر Enter