طور الباحثون نظامًا ذكيًا مصطنعًا يقوم بالعكس تمامًا للعيش في الوقت الحالي. لكنه لا يعتقد فقط خطوات قليلة إلى الأمام – فهو يعتقد ملايين الخطوات إلى الأمام.
قام فريق بقيادة عالم الرياضيات سيرجي جوكوف من معهد كاليفورنيا للتكنولوجيا (Caltech) ، بإنشاء نوع جديد من خوارزمية تعلم الآلة المصممة لحل مشاكل الرياضيات التي تتطلب سلسلة طويلة للغاية من الخطوات. مثل حقًا سلسلة طويلة من الخطوات ؛ نحن نتحدث مليون خطوة أو أكثر.
على وجه التحديد ، تمكنت الذكاء الاصطناعى من إحراز تقدم في مشكلة معقدة تسمى أندروز – كورتيس تخمين ، الذي أدى إلى تعثر علماء الرياضيات لعقود. يسأل التخمين بشكل أساسي: هل يمكن دائمًا حل بعض ألغاز الرياضيات باستخدام مجموعة من التحركات المسموح بها ، مثل إعادة ترتيب الخطوات أو التراجع عنها؟
وقال علي شيهبر ، المؤلف الأول للدراسة وعالم الرياضيات في جامعة روتجرز ، في بيان لتكنولوجيا المعلومات ، إن برنامج Caltech الجديد سعى إلى “العثور على تسلسلات طويلة من الخطوات النادرة ويصعب العثور عليها”. “إنه مثل محاولة العثور على طريقك عبر متاهة بحجم الأرض. هذه مسارات طويلة جدًا يجب عليك اختبارها ، وهناك مسار واحد فقط يعمل. “
في دراسة مسبقة تم نشرها على Arxiv في أغسطس الماضي وتم تحديثها يوم الثلاثاء ، يوضح Shehper وزملاؤه كيف استخدموا الذكاء الاصطناعى المتقدم حديثًا لحل عائلات المشاكل المتعلقة بـ Andrews -Curtis Conjecture ، والتي تتضمن الجبر المجردة. لكي نكون واضحين ، لم يحلوا التخمين نفسه. على الرغم من أن ذلك قد يبدو مضادًا للمناخ ، إلا أن الباحثين دحضوا أمثلة مضادة محتملة مستمرة على التخمين. في حين أن دحض الأمثلة المضادة لا يجعل بالضرورة أن التخمين الأصلي صحيح ، إلا أنه يعزز ذلك.
“إن استبعاد بعض الأمثلة المضادة يعطينا الثقة في صحة التخمين الأصلي ويساعد على بناء حدسنا حول المشكلة الرئيسية” ، أوضح شيربر. “إنه يعطينا طرقًا جديدة للتفكير في الأمر.” قارن جوكوف مشاكل الرياضيات بمكعب روبيك.
“هل يمكنك أن تأخذ مكعب روبيك المخفوق والمعقد وإعادته إلى حالته الأصلية؟ وأوضح: “يجب عليك اختبار هذه التسلسلات الطويلة جدًا من التحركات ، ولن تعرف ما إذا كنت على الطريق الصحيح حتى النهاية”.
فكيف تفعل ذلك؟ أساسا ، من خلال التفكير خارج الصندوق. بعد نهج التعلم التعزيز ، قام الباحثون بتدريب الذكاء الاصطناعى من خلال إطعامها أولاً بمشاكل الرياضيات السهلة تليها مهام صعبة بشكل متزايد. قال شيربر: “إنه يحاول العديد من التحركات ويحصل على مكافأة لحل المشاكل”. “نشجع البرنامج على القيام بالمزيد من الشيء نفسه مع الحفاظ على مستوى من الفضول. في النهاية ، يطور استراتيجيات جديدة أفضل مما يمكن للبشر فعله. هذا هو سحر التعلم التعزيز. “
تعلمت الخوارزمية في النهاية توليد تسلسلات طويلة من التحركات غير المتوقعة ، والتي أطلق عليها الباحثون “تحركات فائقة”. على النقيض من ذلك ، فإن ناتج Chatgpt أكثر مملًا.
“إذا طلبت من ChatGpt كتابة خطاب ، فسيأخذ ذلك بشيء نموذجي. من غير المرجح أن تتوصل إلى أي شيء فريد وأصلي للغاية. قال جوكوف: “إنه ببغاء جيد”. “برنامجنا جيد في التوصل إلى القيم المتطرفة.”
أستطيع أن أفكر في حدث واحد على الأقل من شأنه أن يكون مريحًا حقًا للتنبؤ بمنظمة العفو الدولية: حوادث مالية. ولكن في حين أن برامج التعلم الآلي الحالي لم تحقق هذا المستوى من التطور النذير ، فإن الباحثين يتوقعون أن أساليبهم يمكن أن تسهم ذات يوم في هذا النوع من التنبؤ الذكي.
“في الأساس ، يعرف برنامجنا كيف يتعلم التعلم” ، أوضح جوكوف. “إنه يفكر خارج الصندوق.” وأضاف أن الفريق قام “بتحسينات كبيرة في مجال الرياضيات كان عمرها عقود”. والأكثر من ذلك ، أن جوكوف وزملاؤه قد أعطى الأولوية للمناهج التي لا تحتاج إلى كميات كبيرة من قوة الحوسبة ، مما يجعل عملهم في متناول أكاديميين آخرين مع أجهزة كمبيوتر صغيرة الحجم.
على الرغم من أن التطبيقات العملية لهذا الإنجاز قد لا تكون واضحة في حياتنا اليومية ، فإن عملهم ينضم إلى مجموعة من الباحثين الآخرين الذين يقومون بتحسين خوارزميات تعلم الآلات لحل مشاكل الإنسانية (وليس لتدمير حضارتنا).