Qwen 2.5-Max يتفوق على Deepseek V3 في بعض المعايير

استجابة Alibaba لـ Deepseek هي Qwen 2.5-Max ، أحدث نموذج على نطاق واسع في الشركة (MOE).

يفتخر Qwen 2.5-Max بتدريب أكثر من 20 تريليون رموزًا وتصنيعًا من خلال التقنيات المتطورة مثل التثبيت الخاضع للإشراف (SFT) والتعلم التعزيز من التعليقات البشرية (RLHF).

مع وجود واجهة برمجة التطبيقات المتوفرة الآن من خلال Alibaba Cloud والنموذج الذي يمكن الوصول إليه للاستكشاف عبر Qwen Chat ، تقوم شركة Tech Tech العملاقة الصينية بدعوة المطورين والباحثين لرؤية اختراقاته مباشرة.

يتفوق على الأقران

عند مقارنة أداء QWEN 2.5-MAX مقابل بعض نماذج الذكاء الاصطناعي الأبرز في مجموعة متنوعة من المعايير ، فإن النتائج واعدة.

شملت التقييمات مقاييس شائعة مثل MMLU-PRO لحل المشكلات على مستوى الكلية ، و LiveCodeBench لخبرة الترميز ، و LiveBench للقدرات الشاملة ، و Arena Hard لتقييم النماذج ضد التفضيلات البشرية.

وفقًا لألبابا ، “يتفوق Qwen 2.5-Max على Deepseek V3 في معايير مثل Arena-Hard و LiveBench و LiveCodeBench و GPQA-Diamond ، مع إظهار النتائج التنافسية أيضًا في تقييمات أخرى ، بما في ذلك MMLU-Pro.”

يتنافس نموذج الإرشادات-المصمم للمهام المصب مثل الدردشة والترميز-مباشرة مع النماذج الرائدة مثل GPT-4O و Claude-3.5-Sonnet و Deepseek V3. من بين هؤلاء ، تمكنت Qwen 2.5-Max من التفوق على المنافسين في العديد من المجالات الرئيسية.

أسفرت مقارنات النماذج الأساسية أيضًا عن نتائج واعدة. بينما ظلت نماذج ملكية مثل GPT-4O و Claude-3.5-Sonnet بعيدة عن متناول ) ، و Qwen2.5-72b. مرة أخرى ، أظهر الوافد الجديد لأبابا أداءً استثنائياً في جميع المجالات.

“لقد أظهرت نماذجنا الأساسية مزايا كبيرة عبر معظم المعايير ،” صرحت علي بابا ، “ونحن متفائلون بأن التطورات في تقنيات ما بعد التدريب سترفع الإصدار التالي من QWEN 2.5-MAX إلى آفاق جديدة.”

جذبت انفجار Deepseek V3 الانتباه من مجتمع الذكاء الاصطناعي بأكمله إلى نماذج Moe واسعة النطاق. في الوقت نفسه ، قمنا ببناء QWEN2.5-MAX ، وهو عبارة عن مجموعة كبيرة من Moe LLM على بيانات ضخمة وبعد تدريبها مع وصفات SFT و RLHF المنسقة. يحقق تنافسية … pic.twitter.com/ohvl16vfje

– Qwen (alibaba_qwen) 28 يناير 2025

جعل Qwen 2.5-Max يمكن الوصول إليه

لجعل النموذج أكثر سهولة للمجتمع العالمي ، قامت Alibaba بدمج QWEN 2.5-MAX مع منصة الدردشة QWEN الخاصة بها ، حيث يمكن للمستخدمين التفاعل مباشرة مع النموذج في قدرات مختلفة-سواء أكان استكشاف قدرات البحث أو اختبار فهمها للاستعلامات المعقدة.

للمطورين ، يتوفر الآن Qwen 2.5-Max API من خلال Alibaba Cloud تحت اسم النموذج “Qwen-Max-2025-01-25”. يمكن للمستخدمين المهتمين البدء عن طريق تسجيل حساب Alibaba Cloud ، وتفعيل خدمة استوديو النموذج ، وإنشاء مفتاح API.

API متوافق حتى مع النظام الإيكولوجي لـ Openai ، مما يجعل التكامل واضحًا للمشاريع الحالية وسير العمل. هذا التوافق يقلل من حاجز أولئك الذين يتوقون إلى اختبار تطبيقاتهم بقدرات النموذج.

قامت Alibaba ببيان نوايا قوي مع Qwen 2.5-Max. إن التزام الشركة المستمر بتوسيع نطاق نماذج الذكاء الاصطناعى لا يتعلق فقط بتحسين معايير الأداء ولكن أيضًا حول تعزيز القدرات الأساسية للتفكير والتفكير في هذه الأنظمة.

“إن تحجيم البيانات وحجم النموذج لا يعرض التقدم في الذكاء النموذجي فحسب ، بل يعكس أيضًا التزامنا الثابت بالأبحاث الرائدة”.

في المستقبل ، يهدف الفريق إلى دفع حدود تعلم التعزيز لتعزيز مهارات التفكير الأكثر تقدماً. ويقولون إن هذا يمكن أن يمكّن نماذجهم من المطابقة فحسب ، بل يتجاوز الذكاء البشري في حل المشكلات المعقدة.

الآثار المترتبة على الصناعة يمكن أن تكون عميقة. مع تحسن أساليب التحجيم وتراجع نماذج QWEN ، من المحتمل أن نرى المزيد من التموجات عبر حقول AI-GRAVENT على مستوى العالم والتي رأيناها في الأسابيع الأخيرة.

(تصوير مايكو أموريم)

انظر أيضا: تهدف حكومة ChatGPT إلى تحديث الوكالات الحكومية الأمريكية

هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الكبيرة من قادة الصناعة؟ تحقق من AI و Big Data Expo الذي يقام في أمستردام ، كاليفورنيا ، ولندن. تم تحديد الحدث الشامل مع الأحداث الرائدة الأخرى بما في ذلك مؤتمر الأتمتة الذكي ، و blockx ، وأسبوع التحول الرقمي ، ومعرض Cyber Security & Cloud.

استكشاف أحداث وندوات الويب القادمة الأخرى التي تعمل بها TechForge هنا.

العلامات: الذكاء الاصطناعي ، علي بابا ، الذكاء الاصطناعي ، نماذج ، Qwen ، Qwen 2.5

مقالات قد تهمك

غوغل وسامسونج تطوران أداة لتحسين تجربة الألعاب على الهواتف الذكية.

“ترجمة جوجل” تتحول إلى مدرّب لغوي.. ميزة جديدة قادمة تصحّح النطق بالذكاء الاصطناعي

أجهزة الكمبيوتر المحمولة التي تعمل باللمس تفقد شعبيتها حاليًا.

يواجه كلود تقطير نموذج الذكاء الاصطناعي “على المستوى الصناعي”.

نوكيا وأمازون ويب سيرفيسز تجربان أتمتة الذكاء الاصطناعي لتقطيع شبكات الجيل الخامس (5G).

استكشاف الذكاء الاصطناعي في قطاع البيع بالتجزئة بآسيا والمحيط الهادئ.

كيف تدمج المؤسسات المالية الذكاء الاصطناعي في عمليات اتخاذ القرار.

يكشف (Murder Mystery 2) عن سلوك ناشئ للاعبين عبر الإنترنت.

يستهدف نموذج تنبؤ بالذكاء الاصطناعي تحسين كفاءة موارد الرعاية الصحية.

يقود الذكاء الاصطناعي التوكيلي (Agentic AI) العائد على الاستثمار المالي في أتمتة الحسابات الدائنة.

قراصنة مدعومون من دول يستغلون الذكاء الاصطناعي في هجمات سيبرانية: جوجل.

كيف يفصل المنطق والبحث عن تعزيز قابلية التوسع لعامل الذكاء الاصطناعي.

مقارنة بين Samsung Galaxy Z Fold 6 و Galaxy S24 Ultra: لا تخطئ

يحصل iPhone على أول تطبيق إباحي أصلي له

سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

كل ما تريد معرفته عن Reacher الموسم الثالث

Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

رسمياً: يمكنك لعب GTA Online مجانًا الآن على جميع المنصات المنزلية

استخدم chatgpt بالعربي مجانا بدون تسجيل

يمكنك الآن لعب Resident Evil الأصلية على جهاز الكمبيوتر بكل مجدها القديم

رائج الآن