كشفت مايكروسوفت عن معيار رائد يسمى Windows Agent Arena لاختبار وكلاء الذكاء الاصطناعي في بيئات نظام التشغيل ويندوز الواقعية.
وتهدف هذه المنصة الجديدة إلى تسريع تطوير مساعدي الذكاء الاصطناعي القادرين على أداء المهام الحاسوبية المعقدة عبر تطبيقات متنوعة.
ونشر باحثو مايكروسوفت بحثًا يتناول التحديات الحرجة في تقييم أداء وكيل الذكاء الاصطناعي. وكتب الباحثون: “تُظهر النماذج اللغوية الكبيرة إمكانات ملحوظة للعمل بصفتها وكلاء حاسوبية، وتعزيز الإنتاجية البشرية وإمكانية الوصول إلى البرامج في المهام المتعددة الوسائط التي تتطلب التخطيط والمنطق، مع أن قياس أداء الوكيل في بيئات واقعية يُعد تحديًا”.
وتوفر منصة Windows Agent Arena أرضية اختبار قابلة للتكرار لتفاعل وكلاء الذكاء الاصطناعي مع تطبيقات ويندوز الشائعة ومتصفحات الويب وأدوات النظام، مما يعكس تجارب المستخدم البشري.
وتتضمن المنصة أكثر من 150 مهمة متنوعة تشمل تحرير المستندات وتصفح الويب والبرمجة وإعداد النظام.
وتستطيع Windows Agent Arena إجراء الاختبارات بالتوازي عبر مجموعة من الآلات الافتراضية في سحابة Azure من مايكروسوفت.
وتنص الورقة البحثية على أن المعيار قابل للتطوير ويستطيع إجراء الاختبارات بالتوازي بسلاسة في Azure لتقييم معياري كامل في أقل من 20 دقيقة، مما يسرع دورة التطوير مقارنة بالاختبار المتسلسل التقليدي الذي قد يستغرق أيامًا.
ومن أجل إظهار قدرات المنصة، قدمت مايكروسوفت وكيل ذكاء اصطناعي متعدد الوسائط جديد يسمى Navi.
وفي الاختبارات، حقق Navi معدل نجاح قدره 19.5 في المئة في مهام Windows Agent Arena، مقارنةً بمعدل نجاح قدره 74.5 في المئة للبشر.
وتسلط هذه النتائج الضوء على التقدم المحرز والتحديات التي لا تزال قائمة في تطوير الذكاء الاصطناعي الذي قد يضاهي القدرات البشرية في تشغيل الحواسيب.
وقالت مايكروسوفت: “توفر Windows Agent Arena بيئة واقعية وشاملة لدفع حدود وكلاء الذكاء الاصطناعي. من خلال جعل معيارنا مفتوح المصدر، نأمل تسريع البحث في هذا المجال الحاسم عبر مجتمع الذكاء الاصطناعي”.
ويأتي إطلاق Windows Agent Arena وسط تكثيف المنافسة بين عمالقة التكنولوجيا لتطوير مساعدي الذكاء الاصطناعي القادرين على أتمتة المهام الحاسوبية المعقدة.
وقد يمنح تركيز مايكروسوفت على بيئة ويندوز ميزة في سيناريوهات المؤسسات، إذ يظل ويندوز نظام التشغيل المهيمن.
وتُعد الفوائد المحتملة لوكلاء الذكاء الاصطناعي مثل Navi كبيرة، مع أن تطوير مثل هذه التقنيات يثير اعتبارات أخلاقية مهمة.
ومع ازدياد تطور هؤلاء الوكلاء، فإنهم يتمتعون بوصول كبير إلى الحياة الرقمية للمستخدمين، والتفاعل المحتمل مع المعلومات الشخصية والمهنية الحساسة عبر تطبيقات مختلفة.