كشفت OpenAI النقاب عن Operator، وهي أداة تتكامل بسلاسة مع متصفحات الويب لأداء المهام بشكل مستقل. بدءًا من ملء النماذج وحتى طلب البقالة، يعد Operator بتبسيط الأنشطة المتكررة عبر الإنترنت من خلال التفاعل مباشرة مع مواقع الويب من خلال النقرات والكتابة والتمرير.
تم تصميم Operator حول نموذج جديد يسمى وكيل استخدام الكمبيوتر (CUA)، ويجمع بين التعرف على رؤية GPT-4o وإمكانيات التفكير المنطقي المتقدمة – مما يسمح له بالعمل كـ “إنسان داخل المتصفح” افتراضيًا. ومع ذلك، وعلى الرغم من كل ابتكاراتها، يرى خبراء الصناعة مجالًا للتحسين.
شارك يانيس أنطونيو، رئيس قسم الذكاء الاصطناعي والبيانات والتحليلات في شركة Lab49 الاستشارية المتخصصة، أفكاره حول أهمية المشغل وموقعه في المشهد التنافسي لأنظمة الذكاء الاصطناعي للوكلاء.
وكيل AI من خلال واجهة مألوفة
وقال أنطونيو، الذي يتمتع بخبرة تزيد عن عقدين من الزمن في تصميم أنظمة الذكاء الاصطناعي لشركات الخدمات المالية، “إن إعلان OpenAI عن Operator، وهو أحدث غزو لها في حروب الذكاء الاصطناعي الوكيل، هو أمر رائع وغير مكتمل”.
“يتأثر المشغل بشكل واضح بنظام استخدام الكمبيوتر الخاص بـ Anthropic Claude، والذي تم تقديمه مرة أخرى في أكتوبر، حيث يعمل المشغل على تبسيط التجربة عن طريق إزالة الحاجة إلى بنية تحتية معقدة والتركيز على واجهة مألوفة: المتصفح.”
من خلال تصميم المشغل للعمل ضمن بيئة يفهمها المستخدمون بالفعل، يتجنب متصفح الويب OpenAI الحاجة إلى واجهات برمجة تطبيقات أو عمليات تكامل مخصصة.
“من خلال الاستفادة من الواجهة الأكثر شعبية في العالم، تعمل OpenAI على تحسين تجربة المستخدم وتجذب الاهتمام الفوري من عامة الناس. يخلق هذا النهج المرتكز على المتصفح إمكانات كبيرة للتبني على نطاق واسع، وهو أمر كافحت الأنثروبولوجية – على الرغم من ميزتها المبكرة – لتحقيقه.
على عكس بعض الأنظمة المنافسة التي قد تبدو تقنية أو متخصصة في تطبيقها، فإن إطار العمل الذي يركز على المتصفح الخاص بالمشغل يقلل من حاجز الدخول ويمثل خطوة إلى الأمام في جهود OpenAI لإضفاء الطابع الديمقراطي على الذكاء الاصطناعي.
تعامل فريد من نوعه بشأن سهولة الاستخدام والأمان
إحدى السمات المميزة للمشغل هي تركيزه على القدرة على التكيف والأمن، ويتم تنفيذه من خلال بروتوكولات الإنسان في الحلقة. أقر أنطونيو بميزات قابلية الاستخدام المدروسة هذه، لكنه أشار إلى أن هناك حاجة إلى المزيد من العمل.
“من الناحية المعمارية، يعكس تكامل متصفح المشغل بشكل وثيق نظام كلود. يتضمن كلاهما التقاط لقطات شاشة لمتصفح المستخدم وإرسالها للتحليل، بالإضافة إلى التحكم في الشاشة عبر ضغطات المفاتيح الافتراضية وحركات الماوس. ومع ذلك، يقدم المشغل لمسات مدروسة لسهولة الاستخدام.
“تضيف ميزات مثل التعليمات المخصصة لمواقع ويب محددة طبقة من التخصيص، كما أن التركيز على إجراءات الحماية البشرية ضد الإجراءات غير المصرح بها – مثل عمليات الشراء أو إرسال رسائل البريد الإلكتروني أو التقدم للوظائف – يُظهر وعي OpenAI بالمخاطر الأمنية المحتملة التي قد تطرحها من خلال مواقع الويب الضارة، ولكن من الواضح أن هناك حاجة إلى مزيد من العمل لجعل هذا النظام آمنًا على نطاق واسع عبر مجموعة متنوعة من السيناريوهات.
قامت OpenAI بتطبيق إطار أمان متعدد الطبقات للمشغل، بما في ذلك وضع الاستيلاء على المدخلات الآمنة، وتأكيدات المستخدم قبل الإجراءات المهمة، وأنظمة المراقبة لاكتشاف السلوك العدائي. علاوة على ذلك، يمكن للمستخدمين حذف بيانات التصفح وإدارة إعدادات الخصوصية مباشرة داخل الأداة.
ومع ذلك، أكد أنطونيو أن هذه التدابير لا تزال تتطور – خاصة وأن العميل يواجه مهام معقدة أو حساسة.
مشغل OpenAI يزيد من ديمقراطية الذكاء الاصطناعي
ويرى أنطونيو أيضًا أن إطلاق Operator يمثل لحظة محورية في مشهد الذكاء الاصطناعي للمستهلك، وإن كان لا يزال في مراحله الأولى.
“بشكل عام، هذه محاولة أولى ممتازة لبناء نظام وكيل للمستخدمين العاديين، مصمم حول كيفية تفاعلهم بشكل طبيعي مع التكنولوجيا. ومع تطور النظام – مع إمكانات إضافية وضوابط أمنية أكثر قوة – فإن هذا الإصدار المحدود، بسعر 200 دولار شهريًا، سيكون بمثابة أرض اختبار.
“بمجرد نضجها وتوسيعها إلى مستويات الاشتراك الأدنى والإصدار المجاني، فإن Operator لديه القدرة على الدخول في عصر الوكلاء الذين يتعاملون مع المستهلك، مما يزيد من ديمقراطية الذكاء الاصطناعي ودمجه في الحياة اليومية.”
تم تصميم Operator في البداية لمستخدمي Pro بسعر مميز، وهو يوفر لـ OpenAI فرصة للتعلم من المستخدمين الأوائل وتحسين قدراته.
وأشار أنطونيو إلى أنه على الرغم من أن مبلغ 200 دولار شهريًا قد لا يبرر بعد قيمة النظام بالنسبة لمعظم المستخدمين، فإن الاستثمار في جعل المشغل أكثر قوة ويمكن الوصول إليه يمكن أن يؤدي إلى مزايا تنافسية كبيرة لـ OpenAI على المدى الطويل.
“هل يستحق 200 دولار شهريا؟ ربما ليس بعد. ولكن مع تطور النظام، سوف يتسع خندق OpenAI، مما يجعل من الصعب على المنافسين اللحاق به. والآن، يعود التحدي إلى شركتي Anthropic وGoogle – وكلاهما أظهر قدرات مماثلة في المنتجات المتخصصة أو التي تركز على الهندسة – للاستجابة والبقاء في اللعبة”.
مع استمرار OpenAI في تحسين المشغل، أصبحت إمكانية إحداث ثورة في كيفية تفاعل الأشخاص مع التكنولوجيا واضحة. بدءًا من التعاون مع شركات مثل Instacart وDoorDash وUber وحتى استخدام الحالات في القطاع العام، يهدف Operator إلى تحقيق التوازن بين الابتكار والثقة والسلامة.
في حين أن القيود والتسعير المبكر قد يمنع التبني على نطاق واسع في الوقت الحالي، إلا أن هذه العقبات قد تكون مؤقتة فقط حيث تلتزم OpenAI بتعزيز سهولة الاستخدام وإمكانية الوصول بمرور الوقت.
أنظر أيضا: تجادل شركة OpenAI ضد حذف بيانات ChatGPT في المحكمة الهندية
هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الضخمة من قادة الصناعة؟ اطلع على معرض الذكاء الاصطناعي والبيانات الضخمة الذي يقام في أمستردام وكاليفورنيا ولندن. ويقام هذا الحدث الشامل في موقع مشترك مع أحداث رائدة أخرى بما في ذلك مؤتمر الأتمتة الذكية، وBlockX، وأسبوع التحول الرقمي، ومعرض الأمن السيبراني والسحابي.
استكشف الأحداث والندوات عبر الإنترنت القادمة الأخرى المتعلقة بتكنولوجيا المؤسسات والمدعومة من TechForge هنا.