Close Menu
تقنية نيوزتقنية نيوز

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    مقالات قد تهمك

    يمكن لـ NotebookLM تحويل البيانات غير المنظمة إلى جداول لـ “جداول بيانات Google”.

    25 ديسمبر, 2025

    يُقدم عرض يتضمن Office وWindows 11 Pro بسعر 40 دولارًا.

    25 ديسمبر, 2025

    هاتفُك أكثر إثارةً للاشمئزاز من أرضية الحمام، وفقًا لدراسة.

    25 ديسمبر, 2025
    فيسبوك X (Twitter) الانستغرام
    • من نحن
    • سياسة الخصوصية
    • اتصل بنا
    فيسبوك X (Twitter) الانستغرام يوتيوب
    تقنية نيوزتقنية نيوز
    • الرئيسية
    • اخر الاخبار
    • هواتف ذكية
    • كمبيوتر
    • برامج وتطبيقات
    • شركات
      • ابل
      • سامسونج
      • جوجل
      • مايكروسوفت
      • أمازون
    • المزيد
      • الذكاء الإصطناعي
      • الأمن الإلكتروني
      • ألعاب
      • منوعات تقنية
    اشترك معنا
    تقنية نيوزتقنية نيوز
    الرئيسية » Openai يحفر لماذا تكذب chatbots عن قصد وخداع البشر
    اخر الاخبار

    Openai يحفر لماذا تكذب chatbots عن قصد وخداع البشر

    فريق التحريربواسطة فريق التحرير19 سبتمبر, 20250 زيارةلا توجد تعليقات
    شاركها فيسبوك تويتر بينتيريست لينكدإن Tumblr رديت تيلقرام البريد الإلكتروني
    شاركها
    فيسبوك تويتر لينكدإن بينتيريست البريد الإلكتروني

    في هذه المرحلة ، يعلم معظم الناس أن chatbots قادرة على الاستجابات الهلوسة ، ويشكلون مصادر ، وبصق المعلومات الخاطئة. لكن يمكن أن تكمن chatbots بطرق أكثر تشبه الإنسان ، “التخطيط” لإخفاء أهدافهم الحقيقية وخداع البشر الذين أعطواهم تعليمات. يبدو أن بحثًا جديدًا من Openai و Apollo Research قد اكتشف طرقًا لتخفيض بعض هذه الأكاذيب ، لكن حقيقة أنه يحدث على الإطلاق يجب أن يمنح المستخدمين توقفًا مؤقتًا.

    في صميم القضية مع الذكاء الاصطناعي عن عمد ، يكون المستخدم “اختلالًا” – محددًا على أنه ما يحدث عندما تتبع الذكاء الاصطناعى هدفًا غير مقصود. يقدم الباحثون كمثال على ذلك ، “يمكن أن يتعلم منظمة العفو الدولية كسب المال أن تتعلم السرقة ، في حين أن الهدف المقصود هو كسب المال من الناحية القانونية وأخلاقية فقط”. إن التخطيط هو ما يحدث عندما يحاول النموذج إخفاء حقيقة أنه غير محدد ، ونظرية الباحثين أن النموذج يفعل هذا لحماية نفسه وأهدافه الخاصة. هذا يختلف بالتأكيد عن الهلوسة ، والتي تشير إليها ورقة حديثة نشرتها Openai هي نتيجة لمكافأة النماذج على التخمين أكثر من الاعتراف بعدم اليقين.

    لمعالجة هذه المشكلة ، وضع الباحثون النماذج من خلال ما يسمونه تقنية تدريب مكافحة الخلاص المعروفة باسم “المحاذاة التداولية”. أوضح Openai أن هذه الطريقة ، التي تعمل مع LLMs يمكنها إنتاج آثار “سلسلة الفكرة” التي توضح كيفية عملها من خلال الاستعلامات ، وتعلم مواصفات السلامة النموذجية وتجعلها تفكر في هذه المواصفات قبل الإجابة. من المحتمل أن يكون من المفرط أن يقولوا إنهم أخبروا الآلات بعدم الكذب بشكل أساسي ، ولكن يبدو أنها نسخة أكثر تعقيدًا من ذلك.

    وكانت النتائج إيجابية جدا. وفقًا للباحثين ، لاحظوا انخفاضًا 30x في “الإجراءات السرية” ، أو يحاول إخفاء سلوكيات محددة من المستخدم. عند تطبيقه على نموذج O3 Openai ، قام بتخفيض الإجراءات السرية من 13 ٪ إلى 0.4 ٪ وللأو 4-MINI ، انخفض من 8.7 ٪ إلى 0.3 ٪. (ملاحظة جانبية: اه ، يبدو أن 13 ٪ يشبه التردد العالي جدًا من الخداع من آلة من المفترض أن تتلقى الطلبات.)

    في حين أن هذه الأرقام هي من الواضح أنها تحسن ، إلا أنها ليست صفرًا أيضًا. الشيء هو أن الباحثين لم يكتشفوا كيفية التوقف عن التخطيط تمامًا. وعلى الرغم من أنهم يصرون على أن التخطيط ، من حيث صلته بمعظم استخدامات نماذج الذكاء الاصطناعى ، ليس خطيرًا – فقد يؤدي إلى ، على سبيل المثال ، أن يخبرت ChatGpt للمستخدم بأنها لم تكن مهمة ، على سبيل المثال – لا يمكن أن تزيلها بشكل مستقيم من الكذب. في الواقع ، كتب الباحثون ، “طريقة فشل رئيسية لمحاولة” التدريب “هي ببساطة تعليم النموذج للتخطيط بعناية أكبر وسرية.”

    فهل أصبحت المشكلة أفضل ، أو جعلت النماذج أفضل في إخفاء حقيقة أنهم يحاولون خداع الناس؟ يقول الباحثون إن المشكلة أصبحت أفضل. لن يكذبوا … أليس كذلك؟

    شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr البريد الإلكتروني
    السابقاستدعاء بنك الطاقة في Anker مدعوم الآن من قبل الحكومة
    التالي هواوي تكشف عن Watch Ultimate 2.. ساعة احترافية بميزة التواصل تحت الماء

    المقالات ذات الصلة

    اخر الاخبار

    يُقدم عرض يتضمن Office وWindows 11 Pro بسعر 40 دولارًا.

    25 ديسمبر, 2025
    اخر الاخبار

    وايمو وسانتا مونيكا تتجهان إلى المحكمة بشأن دعوى تتعلق بالإزعاج العام.

    25 ديسمبر, 2025
    اخر الاخبار

    كيفية تتبع رحلة سانتا (Santa) حول العالم ليلة عيد الميلاد.

    25 ديسمبر, 2025
    اخر الاخبار

    بعد 20 عامًا، يظل فيلم “The Christmas Invasion” أفضل حلقة خاصة بعيد الميلاد لمسلسل “Doctor Who”.

    25 ديسمبر, 2025
    اخر الاخبار

    مستقبل بلا فقر أو عمل.. كيف يمكن للذكاء الاصطناعي أن يخلق عالمًا بلا وظائف؟

    25 ديسمبر, 2025
    اخر الاخبار

    أجهزة “كوبيلوت+” المحمولة تنشئ تسميات توضيحية تلقائيًا في “وورد” و”باوربوينت”.

    25 ديسمبر, 2025
    اخر الاخبار

    يصر إيلون ماسك على أبواب تسلا المعيبة رغم التحذيرات.

    25 ديسمبر, 2025
    اخر الاخبار

    مراجعة لسماعة الألعاب اللاسلكية Cherry Xtrfy H3: راحة وعمر افتراضي طويل.

    24 ديسمبر, 2025
    اخر الاخبار

    يُشكل التطور الأخير في (Pluribus) ختامًا مثاليًا للمرحلة التالية.

    24 ديسمبر, 2025
    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    Demo
    اخر الاخبار

    كيفية تسجيل مقاطع فيديو محمية بدون شاشة سوداء

    31 يوليو, 20241٬151 زيارة

    سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

    4 يوليو, 2024816 زيارة

    كل ما تريد معرفته عن Reacher الموسم الثالث

    6 مايو, 2024775 زيارة

    يحصل iPhone على أول تطبيق إباحي أصلي له

    4 فبراير, 2025757 زيارة

    Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

    2 أبريل, 2024721 زيارة

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    رائج الآن
    ألعاب

    إغلاق متجر بلايستيشن على PS3 وPS Vita في دولة جديدة مطلع عام 2026.

    فريق التحرير17 ديسمبر, 2025
    كمبيوتر

    كيفية تسريع الكمبيوتر واللاب توب.. 12 طريقة لجعل ويندوز أسرع

    فريق التحرير25 أبريل, 2025
    منوعات تقنية

    شات جي بي تي بدون تسجيل.. ChatGPT مجانا بالعربي

    فريق التحرير20 مايو, 2025
    رائج الآن

    إغلاق متجر بلايستيشن على PS3 وPS Vita في دولة جديدة مطلع عام 2026.

    17 ديسمبر, 202524 زيارة

    كيفية تسريع الكمبيوتر واللاب توب.. 12 طريقة لجعل ويندوز أسرع

    25 أبريل, 20259 زيارة

    شات جي بي تي بدون تسجيل.. ChatGPT مجانا بالعربي

    20 مايو, 20257 زيارة
    اختيارات المحرر

    يمكن لـ NotebookLM تحويل البيانات غير المنظمة إلى جداول لـ “جداول بيانات Google”.

    25 ديسمبر, 2025

    يُقدم عرض يتضمن Office وWindows 11 Pro بسعر 40 دولارًا.

    25 ديسمبر, 2025

    هاتفُك أكثر إثارةً للاشمئزاز من أرضية الحمام، وفقًا لدراسة.

    25 ديسمبر, 2025

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    تقنية نيوز
    فيسبوك X (Twitter) الانستغرام يوتيوب لينكدإن تيكتوك
    • الرئيسية
    • سياسة الخصوصية
    • من نحن
    • اتصل بنا
    © 2025 تقنية نيوز. جميع حقوق النشر محفوظة.

    اكتب كلمة البحث ثم اضغط على زر Enter