كشفت الأنثروبور عن أحدث عائلة Claude 4 Model ، وهي تبدو وكأنها قفزة لأي شخص يقوم ببناء مساعدين أو ترميز من الذكاء الاصطناعى. نجوم العرض هم كلود أوبوس 4 ، The New Powerhouse ، و Claude Sonnet 4 ، المصممة ليكون أحد مؤسسات الأذواق الذكية.
الأنثروبور ليس خجولًا من طموحاته ، حيث توضح أن هذه النماذج موجهة إلى “تقدم استراتيجيات عملائنا من الذكاء الاصطناعي في جميع المجالات”. إنهم يضعون Opus 4 كأداة “دفع الحدود في الترميز والبحث والكتابة والاكتشاف العلمي” ، بينما يتم وصف Sonnet 4 بأنها “ترقية فورية من Sonnet 3.7” ، على استعداد لجلب “أداء الحدود إلى حالات الاستخدام اليومي”.
كلود أوبوس 4: بطل الترميز الجديد
عندما يستدعي الأنثروبور كلود أوبوس 4 “أقوى نموذج حتى الآن وأفضل نموذج ترميز في العالم” ، فإنك تجلس وتلاحظ. ولديهم الأرقام لدعمها ، حيث تتصدر Opus 4 المخططات في اختبارات الصناعة الحاسمة ، حيث بلغوا 72.5 ٪ على مقعد SWE و 43.2 ٪ على المقعد الطرفي.
ولكن الأمر لا يتعلق فقط بالسباق السريع. تم تصميم Opus 4 لـ Long Rail ، المصمم لـ “الأداء المستمر في المهام طويلة الأمد التي تتطلب جهد مركّز وآلاف الخطوات”. تخيل منظمة العفو الدولية التي يمكن أن “تعمل بشكل مستمر لعدة ساعات” – هذا ما تدعيه الإنسان.
يجب أن تكون هذه خطوة هائلة من نماذج Sonnet السابقة ويمكن أن توسع ما يمكن أن يحققه وكلاء الذكاء الاصطناعي ، معالجة المشكلات التي تتطلب ثباتًا حقيقيًا.
كلود سونيت 4: من أجل الذكاء الاصطناعي اليومي والعمل الوكيل
على الرغم من أن Opus 4 هو بطل الوزن الثقيل ، فإن كلود سونيت 4 يتشكل ليكون العمود الفقري متعدد الاستخدامات ، ويعد دفعة كبيرة لمجموعة كبيرة من التطبيقات. ردود الفعل المبكرة من أولئك الذين لديهم نظرة خاطفة التسلل متوهجة.
على سبيل المثال ، يقول Github “يقول كلود سونيت 4 في سيناريوهات الوكيل” وهو معجب للغاية بأنهم “يخططون لتقديمه كنموذج أساسي لوكيل الترميز الجديد في جيثب كوليوت.” هذا تأييد ضخم.
كما أعجبت المعلق التقنية مانوس ، مما يبرز “التحسينات في اتباع التعليمات المعقدة ، والتفكير الواضح ، والمخرجات الجمالية.”
تستمر المشاعر الإيجابية مع Igent ، والتي “تتفوق Sonnet 4 في تطوير تطبيقات Multi-Meature المستقلة ، بالإضافة إلى تحسن كبير في حل المشكلات وتنقل قاعدة الكود-تقليل أخطاء التنقل من 20 ٪ إلى الصفر القريب.” هذا هو تغيير اللعبة في سير عمل التنمية.
SourceGraph متفائل بنفس القدر ، حيث يرى النموذج على أنه “قفزة كبيرة في تطوير البرمجيات – في المسار المسار لفترة أطول ، وفهم المشكلات بشكل أعمق ، وتوفير جودة رمز أكثر أناقة.”
شهدت رمز زيادة “معدلات النجاح الأعلى ، ومزيد من تعديلات التعليمات البرمجية الجراحية ، والعمل الأكثر دقة من خلال المهام المعقدة” ، مما يؤدي إلى جعل Sonnet 4 “اختيارهم الأفضل لنموذجهم الأساسي”.
أوضاع هجينة وسرات المطورين
واحدة من البتات الذكية حقًا حول عائلة كلود 4 هي طبيعتها الهجينة. يمكن لكل من Opus 4 و Sonnet 4 أن يعملوا في تروسين: أحدهما لأولئك الردود القريبة التي نحتاجها في كثير من الأحيان ، والآخر يسمح “بالتفكير الموسع للتفكير الأعمق”.
يعد وضع التفكير الأعمق هذا جزءًا من خطط Pro و Max و Team و Enterprise Claude. الأخبار السارة للجميع ، على الرغم من-Sonnet 4 ، مع هذا التفكير الممتد ، ستكون متاحة أيضًا للمستخدمين الأحرار ، وهي خطوة رائعة لجعل منظمة العفو الدولية ذات الدرجة العليا أكثر سهولة.
كما أن الأنثروبور تطرح بعض الأدوات الجديدة اللذيذة للمطورين على واجهة برمجة التطبيقات الخاصة بها ، تهدف بوضوح إلى تشحن عملاء الذكاء الاصطناعى الأكثر تطوراً:
- أداة تنفيذ التعليمات البرمجية: يتيح هذا للنماذج تشغيل رمز فعليًا ، وفتح جميع أنواع الإمكانيات للتطبيقات التفاعلية وحل المشكلات.
- MCP Connector: تم تقديمه بواسطة الأنثروبولوجيا ، MCP يتبادل السياق بين مساعدي الذكاء الاصطناعى وبيئات البرمجيات.
- Files API: هذا سيجعل من الأسهل على الذكاء الاصطناعى العمل مباشرة مع الملفات ، وهو أمر كبير للعديد من المهام في العالم الحقيقي.
- التخزين المؤقت السريع: سيتمكن المطورون من مخبأات ذاكرة التخزين المؤقت لمدة تصل إلى ساعة. قد يبدو هذا صغيرًا ، ولكنه قد يحدث فرقًا حقيقيًا في السرعة والكفاءة ، خاصة بالنسبة للاستعلامات المستخدمة بشكل متكرر.
قيادة الحزمة في الأداء في العالم الحقيقي
تحرص الأنثروبور على التأكيد على أن “نماذج Claude 4 لها تؤدي إلى التحقق من Swe-bench ، وهو معيار للأداء في مهام هندسة البرمجيات الحقيقية.” إلى جانب الترميز ، يشددون على أن هذه النماذج “تقدم أداءً قويًا عبر الترميز والتفكير والقدرات متعددة الوسائط والمهام الوكيل”.
على الرغم من القفزات في القدرة ، فإن الأنثروبور تمسك الخط على التسعير. سيعيدك Claude Opus 4 إلى 15 دولارًا لكل مليون رموز إدخال و 75 دولارًا لكل مليون رموز إخراج. يتم تسعير Claude Sonnet 4 ، وهو الخيار الأكثر سهولة ، بمبلغ 3 دولارات لكل مليون رموز إدخال و 15 دولارًا لكل مليون رموز إخراج. سيتم الترحيب بهذا الاتساق من قبل المستخدمين الحاليين.
كل من كلود أوبوس 4 و Sonnet 4 مستعدون للذهاب عبر واجهة برمجة تطبيقات الأنثروبور ، كما يظهران أيضًا على Amazon Bedrock و Google Cloud's Vertex AI. هذا التوفر الواسع يعني أن الشركات والمطورين في جميع أنحاء العالم يمكن أن تبدأ في تجربة ودمج هذه الأدوات الجديدة بسهولة إلى حد ما.
من الواضح أن الأنثروبور تتضاعف على جعل الذكاء الاصطناعي أكثر قدرة ، لا سيما في العوالم المعقدة للترميز وسلوك العامل المستقل. مع هذه النماذج الجديدة وأدوات المطورين ، حصلت إمكانية الابتكار على دفعة خطيرة.
(الصورة الائتمان: الإنسان)
انظر أيضا: تفاصيل تسرب جهاز Openai الطموح Jony Ive

هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الكبيرة من قادة الصناعة؟ تحقق من AI و Big Data Expo الذي يقام في أمستردام ، كاليفورنيا ، ولندن. تم تحديد الحدث الشامل مع الأحداث الرائدة الأخرى بما في ذلك مؤتمر الأتمتة الذكي ، و blockx ، وأسبوع التحول الرقمي ، ومعرض Cyber Security & Cloud.
استكشاف أحداث وندوات الويب القادمة الأخرى التي تعمل بها TechForge هنا.