أعلنت Anthropic عن ترقيات لمحفظة الذكاء الاصطناعي الخاصة بها، بما في ذلك نموذج Claude 3.5 Sonnet المحسن وإدخال Claude 3.5 Haiku، إلى جانب ميزة “التحكم بالكمبيوتر” في النسخة التجريبية العامة.
تُظهر Claude 3.5 Sonnet التي تمت ترقيتها تحسينات كبيرة في جميع المقاييس، مع تطورات ملحوظة بشكل خاص في قدرات الترميز. حقق النموذج نسبة مذهلة بلغت 49.0% وفقًا لمعيار SWE-bench Verified، متجاوزًا جميع النماذج المتاحة للجمهور، بما في ذلك عروض OpenAI وأنظمة الترميز المتخصصة.
في تطور رائد، قدمت Anthropic وظيفة استخدام الكمبيوتر التي تمكن كلود من التفاعل مع أجهزة الكمبيوتر بشكل مشابه للبشر: عرض الشاشات، والتحكم في المؤشرات، والنقر، والكتابة. هذه الإمكانية، الموجودة حاليًا في مرحلة تجريبية عامة، تمثل Claude 3.5 Sonnet كأول نموذج للذكاء الاصطناعي الحدودي يقدم مثل هذه الوظيفة.
وقد بدأت العديد من شركات التكنولوجيا الكبرى بالفعل في تنفيذ هذه القدرات الجديدة.
“يمثل Claude 3.5 Sonnet الذي تمت ترقيته قفزة كبيرة في مجال الترميز المدعوم بالذكاء الاصطناعي،” وفقًا لتقرير GitLab، الذي لاحظ ما يصل إلى 10% من الأسباب المنطقية عبر حالات الاستخدام دون زمن انتقال إضافي.
يتطابق طراز Claude 3.5 Haiku الجديد، المقرر إطلاقه في وقت لاحق من هذا الشهر، مع أداء Claude 3 Opus السابق مع الحفاظ على فعالية التكلفة والسرعة. لقد حققت بشكل ملحوظ 40.6% في اختبار SWE-bench، متفوقة على العديد من النماذج التنافسية بما في ذلك الطراز الأصلي Claude 3.5 Sonnet وGPT-4o.
فيما يتعلق بقدرات التحكم بالكمبيوتر، اتخذت شركة Anthropic نهجًا مدروسًا، معترفًا بالقيود الحالية مع تسليط الضوء على الإمكانات. في معيار OSWorld، الذي يقيم التنقل بين واجهات الكمبيوتر، حقق Claude 3.5 Sonnet نسبة 14.9% في اختبارات لقطات الشاشة فقط، متفوقًا بشكل ملحوظ على نسبة 7.8% التي حققها ثاني أفضل نظام.
خضعت التطورات لتقييمات صارمة للسلامة، مع إجراء اختبارات ما قبل النشر بالشراكة مع معاهد سلامة الذكاء الاصطناعي في الولايات المتحدة والمملكة المتحدة. وتؤكد شركة Anthropic أن معيار ASL-2، كما هو مفصل في سياسة القياس المسؤول الخاصة بها، يظل مناسبًا لهذه النماذج.
(حقوق الصورة: الأنثروبي)
أنظر أيضا: تكشف شركة IBM النقاب عن نماذج Granite 3.0 AI مع التزام مفتوح المصدر
هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الضخمة من قادة الصناعة؟ اطلع على معرض الذكاء الاصطناعي والبيانات الضخمة الذي يقام في أمستردام وكاليفورنيا ولندن. ويقام هذا الحدث الشامل في موقع مشترك مع أحداث رائدة أخرى بما في ذلك مؤتمر الأتمتة الذكية، وBlockX، وأسبوع التحول الرقمي، ومعرض الأمن السيبراني والسحابي.
استكشف الأحداث والندوات عبر الإنترنت القادمة الأخرى المتعلقة بتكنولوجيا المؤسسات والمدعومة من TechForge هنا.