طور باحثون من جامعة طوكيو للعلوم (TUS) طريقة لتمكين نماذج الذكاء الاصطناعي واسعة النطاق من “نسيان” فئات معينة من البيانات بشكل انتقائي.
وقد وفر التقدم في مجال الذكاء الاصطناعي أدوات قادرة على إحداث ثورة في مجالات مختلفة، من الرعاية الصحية إلى القيادة الذاتية. ومع ذلك، مع تقدم التكنولوجيا، تتزايد أيضًا تعقيداتها واعتباراتها الأخلاقية.
لقد أدى نموذج أنظمة الذكاء الاصطناعي واسعة النطاق المدربة مسبقًا، مثل ChatGPT وCLIP (التدريب المسبق على اللغة التقابلية والصورة) من OpenAI، إلى إعادة تشكيل التوقعات بالنسبة للآلات. وقد شهدت هذه النماذج العامة للغاية، القادرة على التعامل مع مجموعة واسعة من المهام بدقة متسقة، اعتمادًا واسع النطاق للاستخدام المهني والشخصي.
ومع ذلك، فإن مثل هذا التنوع يأتي بسعر باهظ. ويتطلب تدريب هذه النماذج وتشغيلها كميات هائلة من الطاقة والوقت، مما يثير مخاوف بشأن الاستدامة، فضلاً عن أنها تتطلب أجهزة متطورة أكثر تكلفة بكثير من أجهزة الكمبيوتر القياسية. ومما يزيد من تفاقم هذه المشكلات أن الميول العامة قد تعيق كفاءة نماذج الذكاء الاصطناعي عند تطبيقها على مهام محددة.
على سبيل المثال، “في التطبيقات العملية، نادرًا ما يكون تصنيف جميع أنواع فئات الكائنات مطلوبًا”، كما يوضح البروفيسور المشارك جو إيري، الذي قاد البحث. “على سبيل المثال، في نظام القيادة الذاتية، سيكون كافياً التعرف على فئات محدودة من الأشياء مثل السيارات والمشاة وإشارات المرور.
“لن نحتاج إلى التعرف على الطعام أو الأثاث أو أنواع الحيوانات. قد يؤدي الاحتفاظ بالفئات التي لا تحتاج إلى التعرف عليها إلى تقليل دقة التصنيف الإجمالية، فضلاً عن التسبب في عيوب تشغيلية مثل إهدار الموارد الحسابية وخطر تسرب المعلومات.
ويكمن الحل المحتمل في نماذج التدريب “لنسيان” المعلومات الزائدة عن الحاجة أو غير الضرورية – وتبسيط عملياتها للتركيز فقط على ما هو مطلوب. وفي حين أن بعض الأساليب الحالية تلبي بالفعل هذه الحاجة، فإنها تميل إلى افتراض نهج “الصندوق الأبيض” حيث يمكن للمستخدمين الوصول إلى البنية الداخلية للنموذج ومعلماته. ومع ذلك، في كثير من الأحيان، لا يحصل المستخدمون على مثل هذه الرؤية.
إن أنظمة الذكاء الاصطناعي “الصندوق الأسود”، الأكثر شيوعا بسبب القيود التجارية والأخلاقية، تخفي آلياتها الداخلية، مما يجعل تقنيات النسيان التقليدية غير عملية. ولمعالجة هذه الفجوة، لجأ فريق البحث إلى التحسين الخالي من المشتقات، وهو نهج يتجنب الاعتماد على الأعمال الداخلية التي يتعذر الوصول إليها في النموذج.
التقدم من خلال النسيان
تقدم الدراسة، المقرر تقديمها في مؤتمر أنظمة معالجة المعلومات العصبية (NeurIPS) في عام 2024، منهجية يطلق عليها اسم “نسيان الصندوق الأسود”.
تقوم العملية بتعديل مطالبات الإدخال (تعليمات نصية يتم تغذيتها للنماذج) في جولات متكررة لجعل الذكاء الاصطناعي “ينسى” فئات معينة تدريجيًا. تعاون البروفيسور المشارك إيري في العمل مع المؤلفين المشاركين يوسوكي كوانا ويوتا جوتو (كلاهما من TUS)، جنبًا إلى جنب مع الدكتور تاكاشي شيباتا من شركة NEC.
في تجاربهم، استهدف الباحثون CLIP، وهو نموذج لغة الرؤية مع قدرات تصنيف الصور. تعتمد الطريقة التي طوروها على استراتيجية تطور التكيف مع مصفوفة التباين (CMA-ES)، وهي خوارزمية تطورية مصممة لتحسين الحلول خطوة بخطوة. في هذه الدراسة، تم تسخير CMA-ES لتقييم وصقل المطالبات المقدمة إلى CLIP، مما يؤدي في النهاية إلى قمع قدرتها على تصنيف فئات صور معينة.
ومع تقدم المشروع، ظهرت التحديات. كافحت تقنيات التحسين الحالية لتوسيع نطاقها لتشمل كميات أكبر من الفئات المستهدفة، مما دفع الفريق إلى ابتكار استراتيجية جديدة لتحديد المعالم تُعرف باسم “مشاركة السياق الكامن”.
يقوم هذا النهج بتقسيم السياق الكامن – تمثيل المعلومات الناتجة عن المطالبات – إلى أجزاء أصغر وأكثر قابلية للإدارة. ومن خلال تخصيص عناصر معينة لرمز مميز واحد (كلمة أو حرف) أثناء إعادة استخدام عناصر أخرى عبر رموز مميزة متعددة، فقد خفضوا تعقيد المشكلة بشكل كبير. والأهم من ذلك، أن هذا جعل العملية قابلة للتتبع حسابيًا حتى بالنسبة لتطبيقات النسيان واسعة النطاق.
من خلال اختبارات قياس الأداء على مجموعات بيانات متعددة لتصنيف الصور، تحقق الباحثون من فعالية نسيان الصندوق الأسود، مما حقق هدف جعل CLIP “ينسى” ما يقرب من 40% من الفئات المستهدفة دون الوصول المباشر إلى البنية الداخلية لنموذج الذكاء الاصطناعي.
يمثل هذا البحث أول محاولة ناجحة للحث على النسيان الانتقائي في نموذج لغة الرؤية للصندوق الأسود، مما يدل على نتائج واعدة.
فوائد مساعدة نماذج الذكاء الاصطناعي على نسيان البيانات
وإلى جانب براعته التقنية، يحمل هذا الابتكار إمكانات كبيرة لتطبيقات العالم الحقيقي حيث تكون الدقة الخاصة بالمهمة ذات أهمية قصوى.
إن تبسيط نماذج المهام المتخصصة يمكن أن يجعلها أسرع وأكثر كفاءة في استخدام الموارد وقدرة على العمل على أجهزة أقل قوة، مما يسرع من اعتماد الذكاء الاصطناعي في المجالات التي كانت تعتبر في السابق غير مجدية.
يكمن الاستخدام الرئيسي الآخر في توليد الصور، حيث يمكن أن يؤدي نسيان فئات كاملة من السياق المرئي إلى منع النماذج من إنشاء محتوى غير مرغوب فيه أو ضار عن غير قصد، سواء كان ذلك مواد مسيئة أو معلومات مضللة.
ولعل الأهم من ذلك هو أن هذه الطريقة تعالج إحدى أكبر المعضلات الأخلاقية للذكاء الاصطناعي: الخصوصية.
غالبًا ما يتم تدريب نماذج الذكاء الاصطناعي، وخاصة تلك واسعة النطاق، على مجموعات بيانات ضخمة قد تحتوي عن غير قصد على معلومات حساسة أو قديمة. إن طلبات إزالة مثل هذه البيانات – خاصة في ضوء القوانين التي تدافع عن “الحق في النسيان” – تشكل تحديات كبيرة.
إن إعادة تدريب نماذج بأكملها لاستبعاد البيانات المثيرة للمشاكل أمر مكلف ويستغرق وقتا طويلا، ومع ذلك فإن مخاطر ترك هذه النماذج دون معالجة قد تؤدي إلى عواقب بعيدة المدى.
ويشير البروفيسور إيري إلى أن “إعادة تدريب نموذج واسع النطاق يستهلك كميات هائلة من الطاقة”. “”النسيان الانتقائي”، أو ما يسمى بإلغاء التعلم الآلي، قد يوفر حلاً فعالاً لهذه المشكلة.”
ولهذه التطبيقات التي تركز على الخصوصية أهمية خاصة في الصناعات ذات المخاطر العالية مثل الرعاية الصحية والتمويل، حيث تعد البيانات الحساسة عنصرًا أساسيًا في العمليات.
مع تسارع السباق العالمي لتطوير الذكاء الاصطناعي، يرسم نهج الصندوق الأسود الذي تتبناه جامعة طوكيو للعلوم طريقا مهما إلى الأمام – ليس فقط من خلال جعل التكنولوجيا أكثر قدرة على التكيف وأكثر كفاءة ولكن أيضا عن طريق إضافة ضمانات كبيرة للمستخدمين.
وفي حين أن احتمال إساءة الاستخدام لا يزال قائما، فإن أساليب مثل النسيان الانتقائي تثبت أن الباحثين يتعاملون بشكل استباقي مع التحديات الأخلاقية والعملية.
أنظر أيضا: لماذا يعد QwQ-32B-Preview هو السبب وراء مشاهدة الذكاء الاصطناعي
هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الضخمة من قادة الصناعة؟ اطلع على معرض الذكاء الاصطناعي والبيانات الضخمة الذي يقام في أمستردام وكاليفورنيا ولندن. ويقام هذا الحدث الشامل في موقع مشترك مع أحداث رائدة أخرى بما في ذلك مؤتمر الأتمتة الذكية، وBlockX، وأسبوع التحول الرقمي، ومعرض الأمن السيبراني والسحابي.
استكشف الأحداث والندوات عبر الإنترنت القادمة الأخرى المتعلقة بتكنولوجيا المؤسسات والمدعومة من TechForge هنا.