على الرغم من حقيقة أنها من صنع البشر، إلا أن النماذج اللغوية الكبيرة لا تزال غامضة تمامًا. إن الخوارزميات عالية الأوكتان التي تدعم طفرة الذكاء الاصطناعي الحالية لدينا لديها طريقة للقيام بأشياء لا يمكن تفسيرها ظاهريًا للأشخاص الذين يراقبونها. وهذا هو السبب وراء وجود الذكاء الاصطناعي إلى حد كبير يطلق عليه “الصندوق الأسود” ظاهرة لا يمكن فهمها بسهولة من الخارج.
يحاول البحث المنشور حديثًا من شركة Anthropic، إحدى أكبر الشركات في صناعة الذكاء الاصطناعي، تسليط بعض الضوء على الجوانب الأكثر إرباكًا في السلوك الخوارزمي للذكاء الاصطناعي. يوم الثلاثاء، نشرت الأنثروبيك أ ورقة ابحاث تم تصميمه لشرح سبب اختيار برنامج الدردشة الآلي الخاص به، كلود، لإنشاء محتوى حول موضوعات معينة على موضوعات أخرى.
أنظمة الذكاء الاصطناعي تم إعدادها في تقريب تقريبي للدماغ البشري – شبكات عصبية ذات طبقات تستقبل المعلومات وتعالجها ثم تتخذ “قرارات” أو تنبؤات بناءً على تلك المعلومات. يتم “تدريب” مثل هذه الأنظمة على مجموعات فرعية كبيرة من البيانات، مما يسمح لها بإجراء اتصالات خوارزمية. عندما تقوم أنظمة الذكاء الاصطناعي بإخراج البيانات بناءً على تدريبها، لا يعرف المراقبون البشريون دائمًا كيف وصلت الخوارزمية إلى هذا الإخراج.
وقد أدى هذا اللغز إلى ظهور مجال منظمة العفو الدولية “التفسير“، حيث يحاول الباحثون تتبع مسار عملية صنع القرار في الآلة حتى يتمكنوا من فهم مخرجاتها. في مجال تفسير الذكاء الاصطناعي، تشير “الميزة” إلى نمط تم تنشيطه “الخلايا العصبية” داخل شبكة عصبية، وهو مفهوم قد تشير إليه الخوارزمية. كلما زاد عدد “الميزات” داخل الشبكة العصبية التي يستطيع الباحثون فهمها، كلما تمكنوا من فهم كيفية قيام بعض المدخلات بتحفيز الشبكة للتأثير على مخرجات معينة.
في مذكرة في النتائج التي توصلوا إليها، يشرح الباحثون الأنثروبيون كيف استخدموا عملية تعرف باسم “تعلم القاموس” لفك رموز أجزاء شبكة كلود العصبية المعينة لمفاهيم محددة. باستخدام هذه الطريقة، يقول الباحثون إنهم تمكنوا من “البدء في فهم سلوك النموذج من خلال رؤية الميزات التي تستجيب لمدخل معين، مما يمنحنا نظرة ثاقبة على “منطق” النموذج لكيفية وصوله إلى استجابة معينة”.
في مقابلة مع فريق البحث الأنثروبيكي الذي أجري بقلم ستيفن ليفي من وايردشرح الموظفون كيف كان الأمر عند فك رموز كيفية عمل “دماغ” كلود. بمجرد أن اكتشفوا كيفية فك تشفير ميزة واحدة، أدى ذلك إلى ميزات أخرى:
إحدى الميزات التي لفتت انتباههم كانت مرتبطة بجسر البوابة الذهبية. لقد رسموا خريطة لمجموعة الخلايا العصبية التي، عند تحفيزها معًا، أشارت إلى أن كلود كان “يفكر” في البنية الضخمة التي تربط سان فرانسيسكو بمقاطعة مارين. علاوة على ذلك، عندما أطلقت مجموعات مماثلة من الخلايا العصبية، أثارت موضوعات كانت مجاورة لجسر البوابة الذهبية: الكاتراز، وحاكم كاليفورنيا جافين نيوسوم، وفيلم هيتشكوك. دوار، والتي تدور أحداثها في سان فرانسيسكو. أخيرًا، حدد الفريق ملايين الميزات، مثل حجر رشيد لفك تشفير شبكة كلود العصبية.
تجدر الإشارة إلى أن شركة أنثروبيك، مثل غيرها من الشركات الربحية، يمكن أن يكون لديها دوافع معينة تتعلق بالأعمال التجارية لكتابة ونشر أبحاثها بالطريقة التي اتبعتها. وقال أن الفريق الورق عاممما يعني أنه يمكنك قراءته بنفسك والتوصل إلى استنتاجاتك الخاصة حول النتائج والمنهجيات التي توصلوا إليها.