طور باحثون من معهد ماساتشوستس للتكنولوجيا (MIT) طريقة لتدريب الروبوتات تقلل الوقت والتكلفة مع تحسين القدرة على التكيف مع المهام والبيئات الجديدة.
يجمع هذا النهج – الذي يسمى المحولات غير المتجانسة المدربة مسبقًا (HPT) – بين كميات هائلة من البيانات المتنوعة من مصادر متعددة في نظام موحد، مما يؤدي بشكل فعال إلى إنشاء لغة مشتركة يمكن لنماذج الذكاء الاصطناعي التوليدية معالجتها. تمثل هذه الطريقة خروجًا كبيرًا عن تدريب الروبوتات التقليدي، حيث يقوم المهندسون عادةً بجمع بيانات محددة للروبوتات الفردية والمهام في بيئات خاضعة للرقابة.
ويعتقد الباحث الرئيسي ليروي وانغ – وهو طالب دراسات عليا في الهندسة الكهربائية وعلوم الكمبيوتر في معهد ماساتشوستس للتكنولوجيا – أنه في حين يشير الكثيرون إلى عدم كفاية بيانات التدريب باعتبارها تحديا رئيسيا في مجال الروبوتات، فإن المشكلة الأكبر تكمن في مجموعة واسعة من المجالات والطرائق وأجهزة الروبوت المختلفة. يوضح عملهم كيفية الجمع بين كل هذه العناصر المتنوعة واستخدامها بشكل فعال.
وقام فريق البحث بتطوير بنية توحد أنواع البيانات المختلفة، بما في ذلك صور الكاميرا وتعليمات اللغة وخرائط العمق. يستخدم HPT نموذج محول، مشابهًا لتلك التي تعمل على تشغيل نماذج اللغة المتقدمة، لمعالجة المدخلات المرئية واستقبال الحس العميق.
وفي الاختبارات العملية، أظهر النظام نتائج رائعة، متفوقًا على أساليب التدريب التقليدية بأكثر من 20% في سيناريوهات المحاكاة والعالم الحقيقي. وقد ظل هذا التحسن صحيحًا حتى عندما واجهت الروبوتات مهامًا تختلف بشكل كبير عن بيانات التدريب الخاصة بها.
قام الباحثون بتجميع مجموعة بيانات رائعة للتدريب المسبق، تضم 52 مجموعة بيانات تضم أكثر من 200000 مسار للروبوت عبر أربع فئات. يتيح هذا النهج للروبوتات التعلم من مجموعة كبيرة من التجارب، بما في ذلك العروض التوضيحية والمحاكاة البشرية.
تكمن إحدى الابتكارات الرئيسية للنظام في تعامله مع استقبال الحس العميق (وعي الروبوت بموقعه وحركته). وقد صمم الفريق الهندسة المعمارية لإعطاء أهمية متساوية لاستقبال الحس العميق والرؤية، مما يتيح حركات أكثر تعقيدًا وحاذقة.
وبالنظر إلى المستقبل، يهدف الفريق إلى تعزيز قدرات HPT على معالجة البيانات غير المسماة، على غرار نماذج اللغة المتقدمة. تتضمن رؤيتهم النهائية إنشاء عقل آلي عالمي يمكن تنزيله واستخدامه لأي روبوت دون تدريب إضافي.
ومع الاعتراف بأنهم في المراحل الأولى، يظل الفريق متفائلًا بأن التوسع يمكن أن يؤدي إلى تطورات مذهلة في السياسات الروبوتية، على غرار التقدم الذي شوهد في نماذج اللغات الكبيرة.
يمكنك العثور على نسخة من ورقة الباحثين هنا (بي دي إف)
(الصورة من التصوير الفوتوغرافي الممسوس)
أنظر أيضا: كسر حماية روبوتات الذكاء الاصطناعي: الباحثون يدقون ناقوس الخطر بشأن العيوب الأمنية
هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الضخمة من قادة الصناعة؟ اطلع على معرض الذكاء الاصطناعي والبيانات الضخمة الذي يقام في أمستردام وكاليفورنيا ولندن. ويقام هذا الحدث الشامل في موقع مشترك مع أحداث رائدة أخرى بما في ذلك مؤتمر الأتمتة الذكية، وBlockX، وأسبوع التحول الرقمي، ومعرض الأمن السيبراني والسحابي.
استكشف الأحداث والندوات عبر الإنترنت القادمة الأخرى المتعلقة بتكنولوجيا المؤسسات والمدعومة من TechForge هنا.