قدمت Amazon Act Nova Act ، وهو نموذج من الذكاء الاصطناعي المتقدم تم تصميمه للوكلاء الأكثر ذكاءً والذين يمكنهم تنفيذ المهام داخل متصفحات الويب.
في حين أن نماذج اللغة الكبيرة شاعت مفهوم “الوكلاء” كأدوات تجيب على الاستعلامات أو استرداد المعلومات عبر طرق مثل الجيل المتمثل في الاسترجاع (RAG) ، فإن Amazon تتصور شيئًا أكثر قوة. تحدد الشركة الوكلاء ليس فقط على أنهم المستجيبين ، ولكن ككيانات قادرة على أداء مهام ملموسة متعددة الخطوات في بيئات رقمية وبدنية متنوعة.
وقالت أمازون: “إن حلمنا هو أن يقوم الوكلاء بأداء مهام واسعة النطاق ومعقدة ومتعددة الخطوات مثل تنظيم حفل زفاف أو معالجة مهام تكنولوجيا المعلومات لزيادة إنتاجية العمل”.
غالبًا ما تقصر عروض السوق الحالية ، حيث يتطلب العديد من الوكلاء إشرافًا بشريًا مستمرًا ووظائفهم يعتمدون على تكامل API الشامل – وهو أمر غير ممكن لجميع المهام. قانون نوفا هو إجابة أمازون على هذه القيود.
إلى جانب النموذج ، ستصدر Amazon معاينة بحثية لقانون Amazon Nova SDK. باستخدام SDK ، يمكن للمطورين إنشاء وكلاء قادرين على أتمتة مهام الويب مثل إرسال الإخطارات خارج المكتب ، أو جدولة التقويم ، أو تمكين ردود البريد الإلكتروني التلقائية.
تهدف SDK إلى تقسيم سير العمل المعقد إلى “أوامر ذرية” يمكن الاعتماد عليها مثل البحث أو التحقق أو التفاعل مع عناصر واجهة محددة مثل المنسدبات أو النوافذ المنبثقة. يمكن إضافة تعليمات مفصلة لتحسين هذه الأوامر ، مما يسمح للمطورين ، على سبيل المثال ، بتوجيه الوكيل إلى تجاوز عملية التأمين أثناء الخروج.
لزيادة تعزيز الدقة ، تدعم SDK معالجة المتصفح عبر الكاتب المسرحي ، ومكالمات API ، وتكامل Python ، وخيوط متوازية للتغلب على تأخير تحميل صفحة الويب.
قانون نوفا: أداء استثنائي على المعايير
على عكس النماذج التوليدية الأخرى التي تعرض دقة الوسط في المهام المعقدة ، فإن Nova Act تعرض الموثوقية. تبرز Amazon الدرجات المثيرة للإعجاب لنموذجها لأكثر من 90 ٪ على التقييمات الداخلية لقدرات محددة تتحدى المنافسين عادةً.
حقق ACT Nova قربًا 0.939 على معايير نص ويب ScreenSpot ، والذي يقيس تعليمات اللغة الطبيعية للتفاعلات المستندة إلى النص ، مثل ضبط أحجام الخطوط. نماذج متنافسة مثل كلود 3.7 Sonnet (0.900) و Openai's CUA (0.883) خلفها هوامش كبيرة.
وبالمثل ، سجل ACT Nova 0.879 في معيار أيقونة الويب Screenspot ، والذي يختبر التفاعلات مع العناصر المرئية مثل تصنيف نجوم أو أيقونات. في حين أن اختبار الويب Groundui ، المصمم لتقييم كفاءة الذكاء الاصطناعى في التنقل في عناصر واجهة المستخدم المختلفة ، أظهر Nova Act منافسين متخلفون قليلاً ، ترى Amazon أن هذا مجال ناضج للتحسين مع تطور النموذج.
تؤكد أمازون على تركيزها على تقديم الموثوقية العملية. بمجرد أن يتم تصميم وكيل باستخدام وظائف ACT NOVA كما هو متوقع ، يمكن للمطورين نشره بلا رأس ، أو دمجه كأو قبل API ، أو حتى جدولةها لتشغيل المهام بشكل غير متزامن. في حالة استخدام واحدة ، يطلب الوكيل تلقائيًا سلطة للتسليم كل مساء الثلاثاء دون الحاجة إلى تدخل مستمر للمستخدم.
تضع Amazon رؤيتها لوكلاء الذكاء الاصطناعي القابل للتطوير والذكي
تتمثل إحدى ميزات Nova ACT المميزة في قدرتها على نقل فهم واجهة المستخدم إلى بيئات جديدة مع الحد الأدنى من التدريب الإضافي. شاركت Amazon مثيلًا حيث قام Act Nova بأداء رائع في الألعاب القائمة على المتصفح ، على الرغم من أن تدريبه لم يتضمن تجارب ألعاب الفيديو. تعمل هذه المواقف القابلية للتكيف كوكيل متعدد الاستخدامات للتطبيقات المتنوعة.
يتم بالفعل الاستفادة من هذه القدرة في النظام الإيكولوجي الخاص بـ Amazon. ضمن Alexa+، يتيح ACT Nova التنقل عبر الإنترنت الموجهة ذاتيًا لإكمال المهام للمستخدمين ، حتى عندما لا يكون الوصول إلى API شاملًا بدرجة كافية. يمثل هذا خطوة نحو مساعدي الذكاء الاصطناعى الأكثر ذكاءً الذين يمكنهم العمل بشكل مستقل ، وتسخير مهاراتهم بطرق أكثر ديناميكية.
من الواضح أن Amazon هو أن ACT يمثل المرحلة الأولى في مهمة أوسع لصياغة وكلاء AI الذكي والموثوقون القادرين على التعامل مع المهام المتعددة الخطوات المعقدة بشكل متزايد.
يتجاوز التركيز على التعليمات البسيطة ، ينصب تركيز Amazon على عملاء التدريب من خلال التعلم التعزيز عبر سيناريوهات واقعية متنوعة بدلاً من مظاهرات مبسطة للغاية. يعمل هذا النموذج التأسيسي كنقطة تفتيش في منهج تدريبي طويل الأجل لنماذج نوفا ، مما يشير إلى طموح الشركة لإعادة تشكيل مشهد وكيل الذكاء الاصطناعي.
“لم يتم بعد بناء حالات الاستخدام الأكثر قيمة للوكلاء” ، لاحظت أمازون. “سوف يكتشفهم أفضل المطورين والمصممين. هذه المعاينة البحثية لقانون Nova الخاص بنا SDK تمكننا من التكرار إلى جانب هؤلاء البناة من خلال النماذج الأولية السريعة والتعليقات التكرارية.”
ACT Nova هو خطوة نحو جعل وكلاء الذكاء الاصطناعي مفيدة حقًا للمهام الرقمية المعقدة. من إعادة التفكير في المعايير إلى التأكيد على الموثوقية ، تتركز فلسفة التصميم الخاصة بها حول تمكين المطورين على تجاوز ما هو ممكن مع أدوات الجيل الحالي.
انظر أيضا: يوفر الأنثروبور نظرة ثاقبة على “بيولوجيا الذكاء الاصطناعى” لكلود
هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الكبيرة من قادة الصناعة؟ تحقق من AI و Big Data Expo الذي يقام في أمستردام ، كاليفورنيا ، ولندن. تم تحديد الحدث الشامل مع الأحداث الرائدة الأخرى بما في ذلك مؤتمر الأتمتة الذكي ، و blockx ، وأسبوع التحول الرقمي ، ومعرض Cyber Security & Cloud.
استكشاف أحداث وندوات الويب القادمة الأخرى التي تعمل بها TechForge هنا.