لقد تم التغلب للتو على GPT-4o وGemini 1.5 Pro في سباق الذكاء الاصطناعي

هناك قائد جديد، من الناحية الفنية، في السباق من أجل هيمنة مساعد الذكاء الاصطناعي، وهو Claude 3.5 Sonnet الجديد من Anthropic. أعلنت الشركة يوم الخميس أن النموذج الذي تم إصداره حديثًا يتفوق على كل من Gemini 1.5 Pro وChatGPT-4o عبر مجموعة من الاختبارات القياسية.

هذا التكرار الجديد لـ Sonnet هو الأول في خط Anthropic القادم من نماذج 3.5، وهو يتفوق بشكل كبير على نموذج Opus 3.0 الأكثر اتساعًا، ويفعل ذلك بجزء صغير من تكلفة الطاقة للنموذج الأكبر. أصبحت كفاءة الحوسبة جانبًا متزايد الأهمية في تصميم نظام الذكاء الاصطناعي، خاصة مع ارتفاع تكلفة تشغيل وتبريد مراكز بيانات الذكاء الاصطناعي بينما ترتفع البنية التحتية إلى نطاق جيجاوات.

كلود 3.5 السوناتة للرؤية

وكتب فريق الأنثروبيك في منشور بالمدونة: “يعمل Claude 3.5 Sonnet بضعف سرعة Claude 3 Opus”. “إن تعزيز الأداء هذا، إلى جانب التسعير الفعال من حيث التكلفة، يجعل Claude 3.5 Sonnet مثاليًا للمهام المعقدة مثل دعم العملاء الحساس للسياق وتنسيق سير العمل متعدد الخطوات.”

ويقال إن النموذج الجديد قد وضع نتائج مرجعية عبر ثلاثة اختبارات موحدة: التفكير على مستوى الدراسات العليا مع GPQA، والمعرفة على المستوى الجامعي مع MMLU، وكفاءة البرمجة مع HumanEval. لقد تفوقت على Gemini 1.5 Pro من Google، وMeta's Llama-400b، وChatGPT-4o من OpenAI، ولكن ليس بفارق كبير وعادةً ما يكون ذلك ببضع نقاط مئوية فقط.

يتم وصف Sonnet 3.5 على أنه “أقوى نموذج رؤية حتى الآن” لشركة Anthropic. “إنه قادر على أداء عدد من المهام القائمة على الرؤية – مثل تفسير المخططات والرسوم البيانية أو نسخ النص من مصادر صور غير كاملة مثل لقطات الشاشة أو الإيصالات الممسوحة ضوئيًا – بشكل أكثر دقة من Opus 3.0. في الواقع، تفوقت Sonnet 3.5 على Opus 3.0 بما يتراوح بين 6 إلى 17 نقطة عبر معايير الرؤية القياسية الصناعية. يقال أيضًا أن النموذج الجديد أكثر كفاءة في التعامل مع الفكاهة ويمكنه التحدث بطريقة أكثر واقعية.

ستكون Sonnet أيضًا أول منظمة ذكاء اصطناعي بشرية تقدم ميزة القطع الأثرية للمستخدمين. بدلاً من إنشاء صور أو مقتطفات من التعليمات البرمجية مباشرة في تدفق المحادثة، ستقوم Artifacts بإنشاء هذا المحتوى في مساحة مخصصة بجانب الدردشة. يتيح ذلك للمستخدمين إنشاء “مساحة عمل ديناميكية حيث يمكنهم رؤية إبداعات كلود وتحريرها والبناء عليها في الوقت الفعلي، ودمج المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي بسلاسة في مشاريعهم وسير العمل”، كما يزعم فريق Anthropic. وأعلنت أيضًا أن كلود سيدعم قريبًا تعاون الفريق حيث يمكن للشركة تخزين بياناتها ووثائقها ومشاريعها في صومعة مركزية واحدة، حيث يعمل كلود كمساعد عند الطلب.

يمكنك تجربة Claude 3.5 Sonnet اليوم مجانًا على موقع Claude.ai وتطبيق Claude iOS (سيوفر لك اشتراك Claude Pro أو Team حدود أسعار أعلى بكثير). يتوفر أيضًا تكامل الطرف الثالث من خلال Anthropic API وAmazon Bedrock وVertex AI من Google Cloud. ومن المقرر إطلاق Claude Haiku 3.5 وOpus 3.5 في وقت لاحق من العام.

مقالات قد تهمك

MacBook Neo.. هل نجحت آبل في تقديم أرخص ماك بوك دون التضحية بالأداء؟

OpenAI في مرمى الانتقادات بعد صفقة البنتاغون وخطط تطوير “وضع البالغين”

هل تتوفر لديك المؤهلات لشغل منصب (رئيس الشرطة المستقبلي) في ستاربيس، تكساس؟

تشير اختبارات أولية إلى أن تقييم “ChatGPT Health” لبيانات اللياقة قد يثير قلقًا غير مبرر.

يمكن لصور جوجل الآن تضمين صوت في مقاطع الفيديو المُنشأة.

تهدف جوجل إلى تمكين متصفح كروم من تحديد محتوى الويب المُنشأ بشريًا أو بالذكاء الاصطناعي.

تكشف الأبحاث آلية عمل إضافات (Chrome) البسيطة في تعزيز الخصوصية.

تقرير سبلنك: الذكاء الاصطناعي الوكيل يعيد تشكيل أولويات رؤساء أمن المعلومات

تفويلة تطلق خدمة NFC لسداد رسوم الطرق والموازين لشاحنات النقل في مصر

ياهو سكاوت (Yahoo Scout) محرك إجابات بالذكاء الاصطناعي ينافس بيربلكستي وخدمات جوجل.

شاومي تطلق Xiaomi 17 وXiaomi 17 Ultra مع تصاعد أزمة أسعار الذاكرة في 2026

لا تشترِ هذه الطابعة ثلاثية الأبعاد لمجرد عرضها للبيع: بدائل متاحة.

مقارنة بين Samsung Galaxy Z Fold 6 و Galaxy S24 Ultra: لا تخطئ

سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

يحصل iPhone على أول تطبيق إباحي أصلي له

كل ما تريد معرفته عن Reacher الموسم الثالث

Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

إليك أحدث أكواد فري فاير Free Fire Codes المجانية 2025 وشرح طريقة تفعيلها

شات جي بي تي العقل الاصطناعي الذي بدأ يفكر كالبشر

شات جي بي تي بدون تسجيل.. ChatGPT مجانا بالعربي

رائج الآن