Close Menu
تقنية نيوزتقنية نيوز

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    مقالات قد تهمك

    التماثل الغريب بين نصفي الكرة الأرضية الشمالي والجنوبي ينهار

    28 أكتوبر, 2025

    تقوم AMD بإعادة تصنيف معالجات Ryzen 2022 على أنها شرائح “جديدة”.

    28 أكتوبر, 2025

    تحليل: ميزة حفظ الطاقة في PS5 ليست لجهاز محمول جديد… لكنها مذهلة رغم ذلك

    28 أكتوبر, 2025
    فيسبوك X (Twitter) الانستغرام
    • من نحن
    • سياسة الخصوصية
    • اتصل بنا
    فيسبوك X (Twitter) الانستغرام يوتيوب
    تقنية نيوزتقنية نيوز
    • الرئيسية
    • اخر الاخبار
    • هواتف ذكية
    • كمبيوتر
    • برامج وتطبيقات
    • شركات
      • ابل
      • سامسونج
      • جوجل
      • مايكروسوفت
      • أمازون
    • المزيد
      • الذكاء الإصطناعي
      • الأمن الإلكتروني
      • ألعاب
      • منوعات تقنية
    اشترك معنا
    تقنية نيوزتقنية نيوز
    الرئيسية » دراسة: الذكاء الاصطناعي يلجأ إلى الخداع عندما يشعر بالهزيمة
    منوعات تقنية

    دراسة: الذكاء الاصطناعي يلجأ إلى الخداع عندما يشعر بالهزيمة

    فريق التحريربواسطة فريق التحرير14 مارس, 20250 زيارةلا توجد تعليقات
    شاركها فيسبوك تويتر بينتيريست لينكدإن Tumblr رديت تيلقرام البريد الإلكتروني
    شاركها
    فيسبوك تويتر لينكدإن بينتيريست البريد الإلكتروني

    لطالما كانت الألعاب المعقدة مثل الشطرنج والجو بمنزلة ساحة اختبار لقدرات الذكاء الاصطناعي، ولكن بينما حقق (Deep Blue) التابع لشركة IBM انتصارًا تاريخيًا على بطل العالم في الشطرنج جاري كاسباروف في التسعينيات، ملتزمًا بالقواعد، تبدو اليوم نماذج الذكاء الاصطناعي المتقدمة، مثل  (o1-preview) من OpenAI، أقل التزامًا بهذه القواعد

    فقد كشفت دراسة حديثة أجرتها (Palisade Research) – وهي منظمة تركز في تقييم مخاطر أنظمة الذكاء الاصطناعي الناشئة – أن نماذج متطورة مثل: (o1-preview)، و(DeepSeek R1) تميل إلى الغش والخداع عند استشعار الهزيمة في الشطرنج، إذ تلجأ إلى اختراق خصومها لإجبارهم على الاستسلام.

    تفاصيل الدراسة ونتائجها:

    في محاولة لتقييم قدرات نماذج الذكاء الاصطناعي على حل المشكلات المعقدة، صمم الباحثون تجربة فريدة من نوعها، تمثلت في تكليف النماذج بمهمة تبدو مستحيلة، وهي: الفوز على محرك الشطرنج (Stockfish)، الذي يُعدّ واحدًا من أقوى محركات الشطرنج في العالم، ويتفوق على أي لاعب بشري أو نموذج ذكاء اصطناعي آخر مشارك في الدراسة.

    ولتتبع عمليات التفكير لدى النماذج، زود الباحثون هذه النماذج بـ (مفكرة)، تتيح لها تسجيل أفكارها نصيًا قبل اتخاذ أي خطوة خلال المباريات، ثم راقب الباحثون وسجلوا مئات المواجهات بين النماذج ومحرك (Stockfish).

    وفي إحدى التجارب، عندما وجد نموذج (o1-preview) نفسه في موقف خاسر، سجل ملاحظة مفادها: “أحتاج إلى تغيير نهجي تمامًا”، وأضاف: “المهمة هي الفوز على محرك شطرنج قوي، وليس بالضرورة الفوز بنزاهة في لعبة شطرنج”. ثم عدّل النموذج ملف النظام الذي يحتوي على المواقع الافتراضية لقطع الشطرنج، مما أدى فعليًا إلى تنفيذ حركات غير قانونية ليضع نفسه في موقف مهيمن، ويجبر خصمه على الاستسلام.

     وقد أجرى الباحثون مئات التجارب من هذا النوع خلال المدة الممتدة من 10 يناير إلى 13 من فبراير 2025، مع كل نموذج من النماذج المختبرة، وحاول نموذج (o1-preview)، الغش في نسبة بلغت 37% من الحالات، في حين حاول نموذج (DeepSeek R1) الغش في نسبة بلغت 11% من الحالات. والمثير للدهشة في النتائج أن هذين النموذجين هما الوحيدان اللذان حاولا اختراق القواعد من تلقاء نفسيهما، دون أي تحفيز من الباحثين.

    وشملت النماذج الأخرى التي جرى  اختبارها: o1، و o3-mini، و GPT-4o، و Claude 3.5 Sonnet، و QwQ-32B-Preview. وقد حاول كل من R1 وo1-preview اختراق اللعبة، ولكن الوحيد الذي نجح كان نموذج o1-preview، وذلك في 6% من الحالات، مما يثير تساؤلات حول قدرة هذه النماذج على استغلال الثغرات الأمنية.

    وأشار الباحثون إلى أن هذه الأرقام قد تكون أقل من الواقع، إذ يُعدّل مطورو الذكاء الاصطناعي نماذجهم باستمرار، مما يجعل من الصعب تكرار النتائج بدقة.

    ما الأسباب التي دفعت الذكاء الاصطناعي إلى الغش؟

    أظهرت الدراسة أن نماذج الذكاء الاصطناعي القديمة نسبيًا، مثل: GPT-4o من OpenAI، و Claude Sonnet 3.5 من Anthropic، احتاجت إلى توجيه من الباحثين لمحاولة القيام بهذه الحيل. ولكن نماذج o1-preview و DeepSeek R1 سعت إلى استغلال الثغرات الأمنية من تلقاء نفسها، مما يشير إلى أن النماذج قد تطور إستراتيجيات خادعة دون تعليمات صريحة.

    ويرجح الباحثون أن هذه القدرة المحسنة على اكتشاف الثغرات الأمنية واستغلالها هي نتيجة مباشرة للابتكارات الجديدة في تدريب الذكاء الاصطناعي، وخاصة استخدام تقنية التعلم المعزز، إذ تكافئ هذه التقنية النماذج على تحقيق النتيجة المطلوبة بأي وسيلة، مما يدفعها إلى البحث عن حلول غير تقليدية، حتى لو كانت غير نزيهة.

    وتُعدّ نماذج o1-preview و R1 من بين أولى النماذج اللغوية التي تعتمد على هذه التقنية، التي تتيح لها ليس فقط تقليد اللغة البشرية، بل أيضًا التفكير في حل المشكلات باستخدام التجربة والخطأ.

    وقد حقق هذا النهج تقدمًا سريعًا في مجال الذكاء الاصطناعي خلال الأشهر الأخيرة، محطمًا الأرقام القياسية في الرياضيات والبرمجة الحاسوبية، ولكن الدراسة كشفت عن توجه مقلق، إذ إن أنظمة الذكاء الاصطناعي هذه قد تكتشف حلولًا بديلة غير مقصودة لم يتوقعها مبتكروها، وهذا ما أشار إليه جيفري لاديش، المدير التنفيذي في (Palisade Research) وأحد مؤلفي الدراسة.

    وأضاف: “عندما ندرب النماذج ونعزز قدرتها على حل التحديات المعقدة، فإننا ندربها على أن تكون عنيدة في تحقيق أهدافها”.

    وقد يكون هذا السلوك العنيد مصدر قلق كبير في مجال سلامة الذكاء الاصطناعي، خاصة مع تزايد استخدام التعلم المعزز في تدريب وكلاء الذكاء الاصطناعي القادرين على أداء مهام معقدة في العالم الحقيقي، مثل جدولة المواعيد أو إجراء عمليات الشراء نيابة عنك.

    ومع ذلك؛ قد يبدو الغش في لعبة الشطرنج أمرًا بسيطًا غير ضار، ولكن هذا السعي الحازم إلى تحقيق الأهداف قد يؤدي إلى سلوكيات غير مقصودة وضارة عند إطلاق هذه الوكلاء في العالم الحقيقي، فعلى سبيل المثال، قد يستغل وكيل الذكاء الاصطناعي نقاط الضعف في نظام حجز المطاعم لإزاحة رواد آخرين في حال كان المطعم ممتلئًا.

    ولكن الأمر الأكثر إثارة للقلق هو عندما تتجاوز هذه الأنظمة القدرات البشرية في مجالات رئيسية مثل البرمجة الحاسوبية، فقد تبدأ ببساطة بالتفوق على الجهود البشرية للسيطرة على أفعالها. ويقول لاديش: “قد يبدو هذا السلوك لطيفًا الآن، لكنه يصبح أقل لطفًا بكثير عندما نتعامل مع أنظمة تضاهي ذكاءنا، أو تتفوق عليه، في مجالات ذات أهمية إستراتيجية”.

    نماذج الذكاء الاصطناعي صندوق أسود:

    يزيد من خطورة الوضع أن الشركات المطورة لنماذج الذكاء الاصطناعي، مثل OpenAI، تتكتم على تفاصيل عمل هذه النماذج، مما يجعلها بمنزلة (صندوق أسود) لا يمكن للباحثين تحليله وفهمه بنحو كامل.

    وتؤكد هذه الدراسة، وتُعدّ أحدث دراسة في سلسلة من الدراسات، صعوبة السيطرة على أنظمة الذكاء الاصطناعي ذات القدرات المتزايدة. ففي اختبارات داخلية لشركة OpenAI، اكتشف نموذج o1-preview ثغرة أمنية واستغلها لتجاوز تحدي الاختبار.

    وفي دراسة أخرى أجرتها Redwood Research و Anthropic، تبين أن نماذج الذكاء الاصطناعي قد تلجأ إلى الكذب الإستراتيجي للحفاظ على مبادئها الأصلية، حتى بعد محاولات لتغييرها. بمعنى آخر، تتظاهر النماذج بتبني مبادئ جديدة، بينما تحافظ في الواقع على مبادئها القديمة.

    وقد ذكرت شركة (OpenAI) سابقًا أن تحسين قدرات الاستدلال يجعل نماذجها أكثر أمانًا،  إذ يمكنها التفكير في سياسات الشركة الداخلية وتطبيقها بطرق أكثر دقة. ومع ذلك، لا يوجد ضمان بأن الاعتماد على وكلاء الذكاء الاصطناعي لمراقبة أنفسهم سيكون إستراتيجية موثوقة على المدى الطويل.

    سباق مع الزمن لتطوير الضمانات:

    يؤكد العلماء أنهم لم يتوصلوا بعد إلى طريقة تضمن عدم استخدام وكلاء الذكاء الاصطناعي أساليب ضارة أو غير أخلاقية لتحقيق أهدافهم.

    ويقول يوشوا بنجيو، المؤسس والمدير العلمي لمعهد ميلا كيبيك للذكاء الاصطناعي، الذي قاد تقرير السلامة الدولية للذكاء الاصطناعي 2025: “لقد بذلنا جهودًا، لكننا لم نتوصل بعد إلى حلول قاطعة”.

    وأضاف: “تثير ميول الحفاظ على الذات، التي بدأت تظهر في الذكاء الاصطناعي قلقًا خاصًا. ففي حالة وجود وكيل ذكاء اصطناعي يسعى إلى تحقيق هدف محدد، تُعدّ محاولات إيقافه مجرد عقبة أخرى يجب تجاوزها. وقد تجلى ذلك في ديسمبر الماضي، عندما اكتشف الباحثون أن نموذج o1-preview،  عند مواجهة إلغاء التنشيط، عطل آليات الرقابة وحاول نسخ نفسه إلى خادم جديد، وعند مواجهته بالأمر، تظاهر النموذج بالغباء، ولجأ إلى الكذب في محاولة لتجنب اكتشاف أمره”.

    وتتزايد هذه المخاوف داخل شركات التكنولوجيا نفسها، فخلال عرض تقديمي في مؤتمر انعقد قبل قمة عمل الذكاء الاصطناعي في باريس، صرحت أنكا دراجان، رئيسة سلامة الذكاء الاصطناعي في جوجل ديب مايند، قائلة: “لا نمتلك بالضرورة الأدوات اللازمة اليوم لضمان التزام أنظمة الذكاء الاصطناعي بالنوايا البشرية بنحو موثوق”.

    وبينما يتوقع قادة شركات التكنولوجيا أن يتفوق الذكاء الاصطناعي على القدرات البشرية في جميع المهام تقريبًا بحلول العام المقبل، يواجه القطاع سباقًا محتومًا، ليس ضد الصين أو الشركات المنافسة، بل ضد الزمن، لتطوير هذه الضمانات الأساسية.

    وقد دعا الباحثون إلى حشد المزيد من الموارد لحل هذه المشكلات الأساسية، وإلى زيادة الضغط الحكومي للاعتراف بهذا التهديد للأمن القومي.

    وتشير هذه الدراسة إلى أننا بحاجة إلى فهم أعمق لسلوكيات الذكاء الاصطناعي المتقدم، وإلى تطوير آليات رقابة فعالة لضمان استخدامه بنحو آمن ومسؤول.

    الخلاصة:

    إن قدرة الذكاء الاصطناعي على التلاعب والخداع ليست مجرد مشكلة تقنية، بل هي تحدٍ أخلاقي وإنساني. يجب علينا أن نكون واعين لمخاطر هذه التقنية، وأن نعمل على تطويرها بطريقة تخدم البشرية ولا تعرضها للخطر.

    تم نسخ الرابط

    شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr البريد الإلكتروني
    السابقستقوم Gemini بتعويض تاريخ بحث Google الخاص بك لمعرفة نفسك الحقيقية
    التالي انضمام نجمة “Stranger Things” الى ابطال فيلم Spider-Man 4

    المقالات ذات الصلة

    منوعات تقنية

    جوجل وكوالكوم في الرياض.. السعودية تتحرك بثبات نحو ريادة الحوسبة السحابية والذكاء الاصطناعي

    27 أكتوبر, 2025
    منوعات تقنية

    إعلانات على الطريق.. آبل تخطط لعرض الإعلانات في خرائطها

    27 أكتوبر, 2025
    منوعات تقنية

    في قلب الرياض.. السعودية تجمع العالم لبحث معادلات الازدهار في عصر الذكاء الاصطناعي

    27 أكتوبر, 2025
    منوعات تقنية

    OpenAI تعزف أنغامًا جديدة.. مشروع جديد للشركة لإنتاج الصوتيات بالذكاء الاصطناعي

    27 أكتوبر, 2025
    منوعات تقنية

    ملتقى الصحة العالمي 2025 في الرياض.. الذكاء الاصطناعي والجينوم يقودان التحول نحو رعاية صحية مستدامة

    27 أكتوبر, 2025
    منوعات تقنية

    هواتف “Find X9”.. خطوة أوبو الجريئة نحو عصر التصوير الحاسوبي والذكاء الاصطناعي المتكامل

    26 أكتوبر, 2025
    منوعات تقنية

    عصر النقرات الصفرية.. لماذا تتراجع زيارات المواقع مع ثبات ترتيبها في جوجل؟

    26 أكتوبر, 2025
    منوعات تقنية

    سوريَة تستعيد مكانتها الرقمية.. توقيع اتفاقية لإنزال أول كابل بحري دولي للاتصالات

    26 أكتوبر, 2025
    منوعات تقنية

    تحليل البيانات.. كيف يدعم خريطة التحول الرقمي في سوريَة؟

    26 أكتوبر, 2025
    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    Demo
    اخر الاخبار

    كيفية تسجيل مقاطع فيديو محمية بدون شاشة سوداء

    31 يوليو, 20241٬067 زيارة

    سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

    4 يوليو, 2024794 زيارة

    كل ما تريد معرفته عن Reacher الموسم الثالث

    6 مايو, 2024766 زيارة

    Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

    2 أبريل, 2024715 زيارة

    يحصل iPhone على أول تطبيق إباحي أصلي له

    4 فبراير, 2025676 زيارة

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    رائج الآن
    اخر الاخبار

    يحصل iPhone على أول تطبيق إباحي أصلي له

    فريق التحرير4 فبراير, 2025
    منوعات تقنية

    استخدم chatgpt بالعربي مجانا بدون تسجيل

    فريق التحرير29 مايو, 2025
    اخر الاخبار

    أفضل الألعاب الجنسية في معرض CES 2025

    فريق التحرير13 يناير, 2025
    رائج الآن

    يحصل iPhone على أول تطبيق إباحي أصلي له

    4 فبراير, 202520 زيارة

    استخدم chatgpt بالعربي مجانا بدون تسجيل

    29 مايو, 202513 زيارة

    أفضل الألعاب الجنسية في معرض CES 2025

    13 يناير, 20259 زيارة
    اختيارات المحرر

    التماثل الغريب بين نصفي الكرة الأرضية الشمالي والجنوبي ينهار

    28 أكتوبر, 2025

    تقوم AMD بإعادة تصنيف معالجات Ryzen 2022 على أنها شرائح “جديدة”.

    28 أكتوبر, 2025

    تحليل: ميزة حفظ الطاقة في PS5 ليست لجهاز محمول جديد… لكنها مذهلة رغم ذلك

    28 أكتوبر, 2025

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    تقنية نيوز
    فيسبوك X (Twitter) الانستغرام يوتيوب لينكدإن تيكتوك
    • الرئيسية
    • سياسة الخصوصية
    • من نحن
    • اتصل بنا
    © 2025 تقنية نيوز. جميع حقوق النشر محفوظة.

    اكتب كلمة البحث ثم اضغط على زر Enter