هناك قائد جديد، من الناحية الفنية، في السباق من أجل هيمنة مساعد الذكاء الاصطناعي، وهو Claude 3.5 Sonnet الجديد من Anthropic. أعلنت الشركة يوم الخميس أن النموذج الذي تم إصداره حديثًا يتفوق على كل من Gemini 1.5 Pro وChatGPT-4o عبر مجموعة من الاختبارات القياسية.
هذا التكرار الجديد لـ Sonnet هو الأول في خط Anthropic القادم من نماذج 3.5، وهو يتفوق بشكل كبير على نموذج Opus 3.0 الأكثر اتساعًا، ويفعل ذلك بجزء صغير من تكلفة الطاقة للنموذج الأكبر. أصبحت كفاءة الحوسبة جانبًا متزايد الأهمية في تصميم نظام الذكاء الاصطناعي، خاصة مع ارتفاع تكلفة تشغيل وتبريد مراكز بيانات الذكاء الاصطناعي بينما ترتفع البنية التحتية إلى نطاق جيجاوات.
وكتب فريق الأنثروبيك في منشور بالمدونة: “يعمل Claude 3.5 Sonnet بضعف سرعة Claude 3 Opus”. “إن تعزيز الأداء هذا، إلى جانب التسعير الفعال من حيث التكلفة، يجعل Claude 3.5 Sonnet مثاليًا للمهام المعقدة مثل دعم العملاء الحساس للسياق وتنسيق سير العمل متعدد الخطوات.”
ويقال إن النموذج الجديد قد وضع نتائج مرجعية عبر ثلاثة اختبارات موحدة: التفكير على مستوى الدراسات العليا مع GPQA، والمعرفة على المستوى الجامعي مع MMLU، وكفاءة البرمجة مع HumanEval. لقد تفوقت على Gemini 1.5 Pro من Google، وMeta's Llama-400b، وChatGPT-4o من OpenAI، ولكن ليس بفارق كبير وعادةً ما يكون ذلك ببضع نقاط مئوية فقط.
يتم وصف Sonnet 3.5 على أنه “أقوى نموذج رؤية حتى الآن” لشركة Anthropic. “إنه قادر على أداء عدد من المهام القائمة على الرؤية – مثل تفسير المخططات والرسوم البيانية أو نسخ النص من مصادر صور غير كاملة مثل لقطات الشاشة أو الإيصالات الممسوحة ضوئيًا – بشكل أكثر دقة من Opus 3.0. في الواقع، تفوقت Sonnet 3.5 على Opus 3.0 بما يتراوح بين 6 إلى 17 نقطة عبر معايير الرؤية القياسية الصناعية. يقال أيضًا أن النموذج الجديد أكثر كفاءة في التعامل مع الفكاهة ويمكنه التحدث بطريقة أكثر واقعية.
ستكون Sonnet أيضًا أول منظمة ذكاء اصطناعي بشرية تقدم ميزة القطع الأثرية للمستخدمين. بدلاً من إنشاء صور أو مقتطفات من التعليمات البرمجية مباشرة في تدفق المحادثة، ستقوم Artifacts بإنشاء هذا المحتوى في مساحة مخصصة بجانب الدردشة. يتيح ذلك للمستخدمين إنشاء “مساحة عمل ديناميكية حيث يمكنهم رؤية إبداعات كلود وتحريرها والبناء عليها في الوقت الفعلي، ودمج المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي بسلاسة في مشاريعهم وسير العمل”، كما يزعم فريق Anthropic. وأعلنت أيضًا أن كلود سيدعم قريبًا تعاون الفريق حيث يمكن للشركة تخزين بياناتها ووثائقها ومشاريعها في صومعة مركزية واحدة، حيث يعمل كلود كمساعد عند الطلب.
يمكنك تجربة Claude 3.5 Sonnet اليوم مجانًا على موقع Claude.ai وتطبيق Claude iOS (سيوفر لك اشتراك Claude Pro أو Team حدود أسعار أعلى بكثير). يتوفر أيضًا تكامل الطرف الثالث من خلال Anthropic API وAmazon Bedrock وVertex AI من Google Cloud. ومن المقرر إطلاق Claude Haiku 3.5 وOpus 3.5 في وقت لاحق من العام.