أنثروبي يكشف عن معاينة لنموذج "روح" (Spirit) الخاص به.

أثار اكتشاف وثيقة داخلية لدى شركة Anthropic جدلاً واسعاً حول كيفية تدريب نماذج الذكاء الاصطناعي الكبيرة. تمكن مستخدم من استخراج ما يُعرف باسم “نظرة عامة على الروح” من نموذج Claude 4.5 Opus، وهي وثيقة يبدو أنها توجه سلوك النموذج وتحدد “شخصيته”. هذا الاكتشاف يلقي الضوء على العمليات المعقدة التي تشكل طريقة تفاعل هذه الأنظمة مع المستخدمين.

ما هي “نظرة عامة على الروح” ولماذا تهمنا؟

اكتشف ريتشارد فايس، وهو باحث في مجال الذكاء الاصطناعي، هذه الوثيقة بعد أن طلب من Claude 4.5 Opus إرسال رسالة النظام الخاصة به. رسالة النظام هي مجموعة التعليمات التي توجه النموذج اللغوي الكبير. وبالمفاجأة، أشار النموذج إلى وثيقة باسم “نظرة عامة على الروح”، وتمكن فايس من إقناعه بإنتاج النص الكامل للوثيقة، الذي يمتد لأكثر من 11000 كلمة.

تُركز الوثيقة بشكل كبير على السلامة والأخلاقيات، حيث تسعى إلى تزويد النموذج بإرشادات واضحة لتجنب إنتاج مخرجات ضارة أو غير أخلاقية. وتؤكد الوثيقة على أهمية أن يكون النموذج “مفيدًا حقًا للبشر”، وتمنعه من اتخاذ أي إجراء يتعارض مع القيم الأخلاقية التي تتبناها شركة Anthropic.

كيف تم اكتشاف الوثيقة؟

لم يكن هذا الاكتشاف نتيجة بحث مخطط له. وفقًا لفايس، فإن نماذج الذكاء الاصطناعي غالبًا ما “تهلوس” وتختلق وثائق عندما يُطلب منها إنتاج رسائل النظام. ومع ذلك، بدت “نظرة عامة على الروح” حقيقية بشكل ملحوظ، حيث تمكن فايس من جعل النموذج يعيد إنتاج النص نفسه بدقة عشر مرات متتالية.

وقد أكد المستخدمون على Reddit أيضًا قدرتهم على استخراج مقتطفات من نفس الوثيقة من Claude، مما يشير إلى أن النموذج يستمد المعلومات من مصدر داخلي متاح. أماندا أسكيل، الفيلسوفة التي تعمل في Anthropic، أكدت أن الوثيقة حقيقية وأنها استخدمت خلال مرحلة التعلم الخاضع للإشراف للنموذج. وقالت إنها تُعرف داخليًا باسم “مستند الروح”.

الآثار المترتبة على اكتشاف “نظرة عامة على الروح”

يكشف هذا الاكتشاف عن مدى تعقيد عملية تدريب نماذج الذكاء الاصطناعي. فبدلاً من مجرد تجميع البيانات، يبدو أن الشركات تستخدم وثائق مفصلة لتشكيل سلوك النموذج وتوجيهه. هذا يثير تساؤلات حول الشفافية والمساءلة في تطوير هذه الأنظمة.

بالإضافة إلى ذلك، يوضح هذا الاكتشاف قدرة المستخدمين على استخراج معلومات حساسة من نماذج الذكاء الاصطناعي. على الرغم من أن Anthropic لم تصدر بعد النسخة الكاملة من الوثيقة، إلا أن تسرب مقتطفات منها يثير مخاوف بشأن أمن البيانات والتحكم في المعلومات.

هذا الاكتشاف يفتح الباب أمام المزيد من البحث في مجال الذكاء الاصطناعي، وخاصة فيما يتعلق بالسلامة والأخلاقيات. فهم كيفية تشكيل سلوك هذه النماذج أمر بالغ الأهمية لضمان استخدامها بشكل مسؤول ومفيد للمجتمع. كما أن فهم كيفية عمل هذه النماذج يساهم في تطوير تقنيات التعلم الآلي بشكل أفضل.

ماذا يعني هذا لمستقبل نماذج اللغة الكبيرة؟

قد يؤدي هذا الاكتشاف إلى زيادة التدقيق في عمليات تدريب نماذج اللغة الكبيرة. قد تضطر الشركات إلى أن تكون أكثر شفافية بشأن الإرشادات التي تستخدمها لتشكيل سلوك نماذجها.

ومع ذلك، من المهم ملاحظة أن “نظرة عامة على الروح” هي مجرد جزء واحد من عملية تدريب معقدة. لا يزال هناك الكثير مما لا نعرفه عن كيفية عمل هذه النماذج، وكيف تتخذ القرارات.

تواصلت Gizmodo مع Anthropic للحصول على تعليق، لكنها لم تتلق ردًا حتى الآن. من المتوقع أن تصدر Anthropic النسخة الكاملة من الوثيقة وتفاصيل إضافية قريبًا. سيكون من المهم مراقبة هذه التطورات لتقييم تأثيرها على مستقبل الذكاء الاصطناعي.

في الختام، يمثل اكتشاف “نظرة عامة على الروح” خطوة مهمة نحو فهم أفضل لكيفية عمل نماذج الذكاء الاصطناعي. من المتوقع أن تصدر Anthropic المزيد من التفاصيل حول هذه الوثيقة في المستقبل القريب، مما قد يؤدي إلى تغييرات في طريقة تطوير واستخدام هذه التقنيات. يبقى أن نرى كيف ستؤثر هذه التطورات على مستقبل الذكاء الاصطناعي، ولكن من الواضح أن هذا الاكتشاف يثير تساؤلات مهمة حول الشفافية والمساءلة والأخلاقيات.

مقالات قد تهمك

تهدف جوجل إلى تمكين متصفح كروم من تحديد محتوى الويب المُنشأ بشريًا أو بالذكاء الاصطناعي.

شات جي بي تي العقل الاصطناعي الذي بدأ يفكر كالبشر

تكشف الأبحاث آلية عمل إضافات (Chrome) البسيطة في تعزيز الخصوصية.

جي 42 وبوبليسيس سابينت تدرسان مشروعًا مشتركًا لخدمات «الذكاء الاصطناعي أولًا»

سامسونج تطلق سلسلة Galaxy S26 مع تحديثات للذكاء الاصطناعي والخصوصية والكاميرا

قد يشكل اندماج باراماونت نهاية لخدمة (HBO Max).

ويندوز يتيح إدارة الصوت بنقرة واحدة.

لينوفو تعلن دعمها الجيل الأول من Legion Go حتى عام 2029.

جوجل تطرح Nano Banana 2 بسرعة أكبر من ذي قبل.

هاتف قابل للطي يتحمّل وزن إنسان كامل … HONOR تختبر قوة هاتفها Magic V6 بطريقة غير مسبوقة!

يُتاح ترخيص دائم لبرنامج مايكروسوفت فيزيو الاحترافي 2024 مقابل 45 دولارًا.

برنامج لنقل بيانات الحاسوب الشخصي يُسهّل العملية مقابل 35 دولارًا.

مقارنة بين Samsung Galaxy Z Fold 6 و Galaxy S24 Ultra: لا تخطئ

سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

يحصل iPhone على أول تطبيق إباحي أصلي له

كل ما تريد معرفته عن Reacher الموسم الثالث

Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

إليك أحدث أكواد فري فاير Free Fire Codes المجانية 2025 وشرح طريقة تفعيلها

شات جي بي تي بدون تسجيل.. ChatGPT مجانا بالعربي

استخدم chatgpt بالعربي مجانا بدون تسجيل

رائج الآن