Close Menu
تقنية نيوزتقنية نيوز

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    مقالات قد تهمك

    نظارات أوكلي مِتا HSTN AI معروضة اليوم بسعر 339 دولارًا.

    18 فبراير, 2026

    أفضل 10 ألعاب للأطفال التي تعزز التعلم والإبداع

    18 فبراير, 2026

    صدر فيلم “الحرب بين الأرض والبحر” مبكرًا في حقبة (Doctor Who) من إنتاج ديزني.

    17 فبراير, 2026
    فيسبوك X (Twitter) الانستغرام
    • من نحن
    • سياسة الخصوصية
    • اتصل بنا
    فيسبوك X (Twitter) الانستغرام يوتيوب
    تقنية نيوزتقنية نيوز
    • الرئيسية
    • اخر الاخبار
    • هواتف ذكية
    • كمبيوتر
    • برامج وتطبيقات
    • شركات
      • ابل
      • سامسونج
      • جوجل
      • مايكروسوفت
      • أمازون
    • المزيد
      • الذكاء الإصطناعي
      • الأمن الإلكتروني
      • ألعاب
      • منوعات تقنية
    اشترك معنا
    تقنية نيوزتقنية نيوز
    الرئيسية » Openai يحفر لماذا تكذب chatbots عن قصد وخداع البشر
    اخر الاخبار

    Openai يحفر لماذا تكذب chatbots عن قصد وخداع البشر

    فريق التحريربواسطة فريق التحرير19 سبتمبر, 20250 زيارةلا توجد تعليقات
    شاركها فيسبوك تويتر بينتيريست لينكدإن Tumblr رديت تيلقرام البريد الإلكتروني
    شاركها
    فيسبوك تويتر لينكدإن بينتيريست البريد الإلكتروني

    في هذه المرحلة ، يعلم معظم الناس أن chatbots قادرة على الاستجابات الهلوسة ، ويشكلون مصادر ، وبصق المعلومات الخاطئة. لكن يمكن أن تكمن chatbots بطرق أكثر تشبه الإنسان ، “التخطيط” لإخفاء أهدافهم الحقيقية وخداع البشر الذين أعطواهم تعليمات. يبدو أن بحثًا جديدًا من Openai و Apollo Research قد اكتشف طرقًا لتخفيض بعض هذه الأكاذيب ، لكن حقيقة أنه يحدث على الإطلاق يجب أن يمنح المستخدمين توقفًا مؤقتًا.

    في صميم القضية مع الذكاء الاصطناعي عن عمد ، يكون المستخدم “اختلالًا” – محددًا على أنه ما يحدث عندما تتبع الذكاء الاصطناعى هدفًا غير مقصود. يقدم الباحثون كمثال على ذلك ، “يمكن أن يتعلم منظمة العفو الدولية كسب المال أن تتعلم السرقة ، في حين أن الهدف المقصود هو كسب المال من الناحية القانونية وأخلاقية فقط”. إن التخطيط هو ما يحدث عندما يحاول النموذج إخفاء حقيقة أنه غير محدد ، ونظرية الباحثين أن النموذج يفعل هذا لحماية نفسه وأهدافه الخاصة. هذا يختلف بالتأكيد عن الهلوسة ، والتي تشير إليها ورقة حديثة نشرتها Openai هي نتيجة لمكافأة النماذج على التخمين أكثر من الاعتراف بعدم اليقين.

    لمعالجة هذه المشكلة ، وضع الباحثون النماذج من خلال ما يسمونه تقنية تدريب مكافحة الخلاص المعروفة باسم “المحاذاة التداولية”. أوضح Openai أن هذه الطريقة ، التي تعمل مع LLMs يمكنها إنتاج آثار “سلسلة الفكرة” التي توضح كيفية عملها من خلال الاستعلامات ، وتعلم مواصفات السلامة النموذجية وتجعلها تفكر في هذه المواصفات قبل الإجابة. من المحتمل أن يكون من المفرط أن يقولوا إنهم أخبروا الآلات بعدم الكذب بشكل أساسي ، ولكن يبدو أنها نسخة أكثر تعقيدًا من ذلك.

    وكانت النتائج إيجابية جدا. وفقًا للباحثين ، لاحظوا انخفاضًا 30x في “الإجراءات السرية” ، أو يحاول إخفاء سلوكيات محددة من المستخدم. عند تطبيقه على نموذج O3 Openai ، قام بتخفيض الإجراءات السرية من 13 ٪ إلى 0.4 ٪ وللأو 4-MINI ، انخفض من 8.7 ٪ إلى 0.3 ٪. (ملاحظة جانبية: اه ، يبدو أن 13 ٪ يشبه التردد العالي جدًا من الخداع من آلة من المفترض أن تتلقى الطلبات.)

    في حين أن هذه الأرقام هي من الواضح أنها تحسن ، إلا أنها ليست صفرًا أيضًا. الشيء هو أن الباحثين لم يكتشفوا كيفية التوقف عن التخطيط تمامًا. وعلى الرغم من أنهم يصرون على أن التخطيط ، من حيث صلته بمعظم استخدامات نماذج الذكاء الاصطناعى ، ليس خطيرًا – فقد يؤدي إلى ، على سبيل المثال ، أن يخبرت ChatGpt للمستخدم بأنها لم تكن مهمة ، على سبيل المثال – لا يمكن أن تزيلها بشكل مستقيم من الكذب. في الواقع ، كتب الباحثون ، “طريقة فشل رئيسية لمحاولة” التدريب “هي ببساطة تعليم النموذج للتخطيط بعناية أكبر وسرية.”

    فهل أصبحت المشكلة أفضل ، أو جعلت النماذج أفضل في إخفاء حقيقة أنهم يحاولون خداع الناس؟ يقول الباحثون إن المشكلة أصبحت أفضل. لن يكذبوا … أليس كذلك؟

    شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr البريد الإلكتروني
    السابقاستدعاء بنك الطاقة في Anker مدعوم الآن من قبل الحكومة
    التالي هواوي تكشف عن Watch Ultimate 2.. ساعة احترافية بميزة التواصل تحت الماء

    المقالات ذات الصلة

    اخر الاخبار

    صدر فيلم “الحرب بين الأرض والبحر” مبكرًا في حقبة (Doctor Who) من إنتاج ديزني.

    17 فبراير, 2026
    اخر الاخبار

    يتنافس المتأهلون للتصفيات النهائية في (Global Physics Photowalk) لتصوير عالم الجسيمات.

    14 فبراير, 2026
    اخر الاخبار

    بطارية جديدة تُشحن خلال ثوانٍ وتصمد 12,000 دورة

    13 فبراير, 2026
    اخر الاخبار

    يُباع جهاز MacBook Pro بشريط اللمس (Touch Bar) بسعر 410 دولارًا حتى نفاد الكمية.

    13 فبراير, 2026
    اخر الاخبار

    تدعم أدوبي الأمان في برامج Lightroom وInDesign وAfter Effects.

    11 فبراير, 2026
    اخر الاخبار

    يتوفر ترخيص ويندوز مدى الحياة مع تحرير من اشتراكات Office بسعر 20 دولارًا.

    10 فبراير, 2026
    اخر الاخبار

    تكلفة برنامج (MS Project) 2024 تبلغ 45 دولارًا للتخطيط والتتبع والتسليم.

    9 فبراير, 2026
    اخر الاخبار

    يوفر حاسوب “إتش بي” الصغير أداءً قوياً بسعر 350 دولاراً.

    8 فبراير, 2026
    اخر الاخبار

    باحثون يطلبون من سائقي السيارات شرح إشارات راكبي الدراجات بعد صعوبات.

    6 فبراير, 2026
    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    Demo
    اخر الاخبار

    مقارنة بين Samsung Galaxy Z Fold 6 و Galaxy S24 Ultra: لا تخطئ

    25 يوليو, 20241٬178 زيارة

    سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

    4 يوليو, 2024820 زيارة

    يحصل iPhone على أول تطبيق إباحي أصلي له

    4 فبراير, 2025792 زيارة

    كل ما تريد معرفته عن Reacher الموسم الثالث

    6 مايو, 2024779 زيارة

    Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

    2 أبريل, 2024723 زيارة

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    رائج الآن
    ألعاب

    تحديث Battlefield 6 1.1.1.0 متاح الآن — إليكم أحجام التحميل ومواعيد إطلاق الموسم 1

    فريق التحرير28 أكتوبر, 2025
    منوعات تقنية

    شات جي بي تي بدون تسجيل.. ChatGPT مجانا بالعربي

    فريق التحرير20 مايو, 2025
    ألعاب

    جميع ألعاب Assassin's Creed بالترتيب، حسب تاريخ الإصدار والتسلسل الزمني

    فريق التحرير15 يوليو, 2024
    رائج الآن

    تحديث Battlefield 6 1.1.1.0 متاح الآن — إليكم أحجام التحميل ومواعيد إطلاق الموسم 1

    28 أكتوبر, 20257 زيارة

    شات جي بي تي بدون تسجيل.. ChatGPT مجانا بالعربي

    20 مايو, 20256 زيارة

    جميع ألعاب Assassin's Creed بالترتيب، حسب تاريخ الإصدار والتسلسل الزمني

    15 يوليو, 20246 زيارة
    اختيارات المحرر

    نظارات أوكلي مِتا HSTN AI معروضة اليوم بسعر 339 دولارًا.

    18 فبراير, 2026

    أفضل 10 ألعاب للأطفال التي تعزز التعلم والإبداع

    18 فبراير, 2026

    صدر فيلم “الحرب بين الأرض والبحر” مبكرًا في حقبة (Doctor Who) من إنتاج ديزني.

    17 فبراير, 2026

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    تقنية نيوز
    فيسبوك X (Twitter) الانستغرام يوتيوب لينكدإن تيكتوك
    • الرئيسية
    • سياسة الخصوصية
    • من نحن
    • اتصل بنا
    © 2026 تقنية نيوز. جميع حقوق النشر محفوظة.

    اكتب كلمة البحث ثم اضغط على زر Enter