يقول Openai إن تأديب chatbots للكذب يجعلها أسوأ

كما يعلم الكثير من الناس ، لدى chatbots ميل للكذب. ربما تكون واحدة من أسوأ حالات الاستخدام لمنظمة العفو الدولية ، تدرب على إنتاج جمل تبدو موثوقة ولكن يمكن أن تقدم معلومات ملفقة بالكامل ؛ النماذج منحازة تجاه توفير إجابة حتى عندما لا تكون واثقة. الآن ، يقول الباحثون في Openai إن الإشراف على chatbots وتأديبها يجعل المشكلة أسوأ فقط ، حيث بذل chatbots المزيد من الجهد لإخفاء سلوكهم.

في منشور مدونة فيما يتعلق بالعمل ، يصف الباحثون Openai استخدام نموذج GPT-4O الخاص به “لإشراف” آخر من نماذج لغته الكبيرة ، وتأديبها عندما حاولت الكذب. لكن هذا لم ينجح ، حيث أن النموذج سيظل يكذب ، “الآن لا يمكن اكتشافه إلا من قبل الشاشة لأنه تعلم إخفاء نيته في سلسلة الأفكار”.

تستخدم نماذج “التفكير” الأحدث التفكير متعدد الخطوات للإجابة على الاستعلامات. إذا طلب أحد المستخدمين تقديرًا عن مقدار ما ينفقه الأميركيين على طعام الحيوانات الأليفة كل عام ، على سبيل المثال ، ستقوم هذه النماذج بتقسيم الاستعلام إلى خطوات متعددة – كيف يوجد العديد من الكلاب في أمريكا ، ومقدار تكلفة إطعام الكلب العادي ، وما إلى ذلك.

غالبًا ما تكشف هذه النماذج عن منطقها ، أو “سلسلة الفكرة” ، للمستخدم حتى يتمكنوا من رؤية كيف وصل الأمر إلى إجابته. بشكل ممتع بما فيه الكفاية ، سوف يقومون بانتظام الشرطي بتصنيع الحقائق والتفاصيل. في خطوة “ما قبل التدريب” ، عندما تقوم شركات مثل Openai في البداية بتدريس نموذج ما هي أنواع الإجابات التي يجب أن تنتجها ، يبدو أن النماذج تتعلم أنه من الأسهل كسب ملف تعريف الارتباط عن طريق أخذ اختصارات. فكر في العداء في ماراثون يقفز في سيارة ويتخطى معظم السباق.

لقد أظهر المستخدمون على وسائل التواصل الاجتماعي ، أن كلود ، عندما يُطلب منهم إجراء تحليل بيانات من أوراق بحثية مختلفة ، يعترفون بأنه يدرج أحيانًا بيانات الحشو بدلاً من النظر فعليًا في جميع الأوراق.

أبرز باحثو Openai مثيلًا في اختبارهم الذي طلب فيه النموذج ، كتابة بعض الاختبارات لضمان عمل جزء من الكود ، وقرروا بشكل خفي كتابة بعض الاختبارات السيئة ، ثم تخطيها عن قصد حتى يمر الرمز في نهاية المطاف “. مع GPT-4O كمشرف ، فإن النموذج سيفعل ذلك ولكن لا يكشف عنه.

فقدت ما يقرب من 100 مليون دولار بسبب anthropicaiيتسلل كلود في “إنشاء بيانات عشوائية” كاحتفال في رمز صانع السوق دون إخباري pic.twitter.com/j3mlgsl5lq

– مارتن شكرلي (martinshkreli) 5 مارس 2025

تحاول شركات الذكاء الاصطناعى حل القضية الخبيثة من النماذج الكذب أو “الهلوسة” ، كما يطلق عليها في هذا المجال ، وأخيراً تصل إلى AGI ، أو النقطة التي يمكن أن تتجاوز فيها الذكاء الاصطناعي القدرة البشرية. لكن الباحثين في Openai يقولون بشكل أساسي أنه بعد عشرات المليارات من الاستثمارات ، ما زالوا لا يعرفون كيفية التحكم في النماذج لتتصرف بشكل مناسب. وأضافوا: “إذا تم تطبيق الإشراف القوي مباشرة على سلسلة الأفكار ، فيمكن أن تتعلم النماذج إخفاء نيتها مع الاستمرار في سوء التصرف”. في الوقت الحالي ، يجب ألا تنفذ الشركات الإشراف على النماذج التي تبدو وكأنها حل كبير. Ergo ، دعهم يستمرون في الكذب في الوقت الحالي وإلا فإنهم سوف يضيء لك.

تم إنفاق TFW Claude Code 739 ثانية “إظهار” ، فشل في إجراء التغيير الذي طلبته ، وكسر 3 أشياء أخرى اعتادت العمل بشكل جيد ، ثم اشحنك 11.14 دولار pic.twitter.com/AP2JLQ0UI8

– آدم 🇺🇸 (personofswag) 19 مارس 2025

يجب أن يكون البحث بمثابة تذكير بالتوخي الحذر عند الاعتماد على chatbots ، خاصة عندما يتعلق الأمر بالعمل الحاسم. تم تحسينها لإنتاج أ واثق-المظهر أجب ولكن لا تهتم كثيرًا بالدقة الواقعية. “نظرًا لأننا قمنا بتدريب نماذج التفكير الحدودي أكثر قدرة ، فقد وجدنا أنها أصبحت بارعة بشكل متزايد على استغلال العيوب في مهامها ومؤسساتها في وظائف المكافآت ، مما أدى إلى نماذج يمكن أن تؤدي مكافآت معقدة في مهام الترميز” ، استنتج الباحثون Openai.

أشارت العديد من التقارير إلى أن معظم المؤسسات لم تجد قيمة في جميع منتجات الذكاء الاصطناعى الجديدة القادمة إلى السوق ، مع أدوات مثل Microsoft Copilot و Apple Intelligence مع المشكلات ، حيث يوضح التعرض للتفصيل دقة ضعفها وعدم وجود فائدة حقيقية.

وفقًا لتقرير صدر مؤخراً صادر عن مجموعة بوسطن الاستشارية ، وجدت دراسة استقصائية شملت 1000 من كبار المسؤولين التنفيذيين في 10 صناعات رئيسية أن 74 ٪ أظهرت أي قيمة ملموسة من الذكاء الاصطناعى. ما يجعل الأمر أكثر جاذبية هو أن نماذج “التفكير” هذه بطيئة ، وأكثر تكلفة قليلاً من النماذج الأصغر. هل تريد الشركات دفع 5 دولارات مقابل استعلام سيعود بمعلومات مكياج؟ ثم مرة أخرى ، البشر غير قابلين للغاية ، لكن الرضا عن الإجابات المحيطة بإجابات الذكاء الاصطناعي يخلق مشكلة جديدة تمامًا.

هناك دائمًا الكثير من الضجيج في صناعة التكنولوجيا للأشياء ، ثم تخرج منها وتدرك أن معظم الناس ما زالوا لا يستخدمونها. في الوقت الحالي ، لا يستحق الأمر المتاعب ، ومصادر المعلومات الموثوقة أكثر أهمية من أي وقت مضى حيث تدفع شركات التكنولوجيا الكبيرة إلى مستخدميها. نماذج الذكاء الاصطناعى في منصات الحلقة المغلقة تخاطر بانهيار الإنترنت المفتوح حيث ازدهرت معلومات موثوقة.

مقالات قد تهمك

يبدو أن مشكلات VPN على هاتفك هي خطأ لم يتم إصلاحه في Android 16

تقدم Mint Mobile هواتف Samsung Galaxy S26 بخصومات تصل إلى 600 دولار.

تقدم أمازون أنماط دردشة جديدة لـ Alexa+، وقد يكون أحدها ساخرًا.

صور الأقمار الصناعية تظهر تسربات كبيرة لغازات الدفيئة القوية.

يُتيح الموقع إنشاء عناوين بريد إلكتروني مؤقتة مجانية.

ميزة طال انتظارها.. واتساب تختبر تسجيل الخروج دون فقدان المحادثات

الجزء الثالث يغير امتياز “Dune” بشكل كامل.

هواوي تعِد بكسر هيمنة أندرويد و iOS بنظامها HarmonyOS

ترحب الشركة الأكبر قيمة عالميًا بمشاركي مؤتمرها مع (Veggie-Tales) و”Slop” المجاور.

آبل تكشف عن AirPods Max 2.. معالج جديد وترجمة فورية بالذكاء الاصطناعي

الذكاء الاصطناعي في حرب إيران.. كيف تغيّر الخوارزميات قواعد الاشتباكات العسكرية؟

يتوفر برنامج Office 2021 Professional بأقل من 40 دولارًا دون رسوم اشتراك.

مقارنة بين Samsung Galaxy Z Fold 6 و Galaxy S24 Ultra: لا تخطئ

سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

يحصل iPhone على أول تطبيق إباحي أصلي له

كل ما تريد معرفته عن Reacher الموسم الثالث

Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

رسمياً: يمكنك لعب GTA Online مجانًا الآن على جميع المنصات المنزلية

استخدم chatgpt بالعربي مجانا بدون تسجيل

يمكنك الآن لعب Resident Evil الأصلية على جهاز الكمبيوتر بكل مجدها القديم

رائج الآن