مع استمرار التقدم في مجال الروبوتات والذكاء الاصطناعي، أصبحت الجهود المبذولة لجعل الروبوتات أقل رعبًا وإزعاجًا وأكثر ودية وأشبه بالإنسان مجالًا مرغوبًا فيه للتنمية. الآن، يدعي الباحثون الممولون فيدراليًا أنهم قاموا بإنشاء روبوت يمكنه تقليد تعابير وجه الشخص الذي يتحدث إليه.
في الآونة الأخيرة ورقة منشورةشرح باحثون يعملون بموجب منحة من مؤسسة العلوم الوطنية كيف قاموا ببناء أحدث روبوت خاص بهم، “إيمو”، والجهود التي بذلوها لجعل الآلة أكثر استجابة للتفاعلات البشرية. لاحظ الباحثون في بداية البحث أهمية ابتسامة الإنسان في المرآة الاجتماعية:
القليل من الإيماءات أكثر محببة من الابتسامة. ولكن عندما يبتسم شخصان لبعضهما البعض في وقت واحد، يتم تضخيم التأثير: ليس الشعور متبادلًا فحسب، بل أيضًا بالنسبة لكلا الطرفين لتنفيذ الابتسامة في وقت واحد، فمن المحتمل أن يكونا قادرين على استنتاج الحالة العقلية لبعضهما البعض بشكل صحيح مسبقًا.
الروبوت الجديد للباحثين هو “روبوت وجه مجسم”. هذا ليس روبوتهم الأول. أُطلق على النسخة السابقة من الروبوت اسم “Eva”. ومع ذلك، يقول الباحثون أن إيمو أكثر تقدمًا بشكل ملحوظ من إيفا.
كان الهدف من Emo هو تحقيق ما يسميه الباحثون “التعبير المشترك”، أو المحاكاة المتزامنة لتعابير وجه الإنسان. ولتحقيق ذلك، طور الباحثون خوارزمية تنبؤية تم تدريبها على مجموعة بيانات فيديو كبيرة لبشر يقومون بتعبيرات الوجه. يدعي الباحثون أن الخوارزمية التي طوروها قادرة على “التنبؤ بالتعبير المستهدف الذي سينتجه الشخص على أساس التغييرات الأولية والدقيقة فقط في وجهه”. يقول الباحثون إن الخوارزمية تقوم بعد ذلك بتوصيل أجهزة الروبوت بتكوين الوجه الذي يجب محاكاته في “الوقت الفعلي”.
في الواقع، إن جعل الروبوت يقوم بتعبيرات الوجه هي قصة مختلفة. يتم تشغيل تكوينات الوجه المختلفة للروبوت بواسطة 26 محركًا مختلفًا و26 مشغلًا. يقول الباحثون إن غالبية المحركات “موزعة بشكل متماثل” – مما يعني أنها مصممة لإنشاء تعبيرات متماثلة – باستثناء المحرك الذي يتحكم في فك الروبوت. تتحكم ثلاثة محركات في حركات رقبة الروبوت. وفي الوقت نفسه، تسمح المحركات بإنشاء المزيد من التعبيرات غير المتماثلة.
يأتي Emo أيضًا مزودًا بـ “جلد” سيليكون قابل للتبديل يتم تثبيته على وجه الروبوت باستخدام 30 مغناطيسًا. ويشير الباحثون إلى أنه يمكن “استبدال هذا الجلد بتصميمات بديلة لمظهر مختلف ولصيانة الجلد”، مما يجعل الوجه قابلاً للتخصيص. يمتلك الروبوت أيضًا “عيونًا” مزودة بكاميرات RGB عالية الدقة. تسمح هذه الكاميرات لإيمو برؤية المشارك في المحادثة وبالتالي محاكاة تعبيرات وجهه.
في الوقت نفسه، كتب الباحثون أنهم ينشرون ما يسمونه “إطار التعلم الذي يتكون من شبكتين عصبيتين – واحدة للتنبؤ بتعبيرات وجه إيمو (النموذج الذاتي) والأخرى للتنبؤ بتعبيرات وجه المتحدث (نموذج المحادثة). ” عندما تقوم بتجميع البرامج والأجهزة معًا، فإن ما تحصل عليه هو جهاز يمكنه القيام بأشياء مثل هذه: