استجابة Alibaba لـ Deepseek هي Qwen 2.5-Max ، أحدث نموذج على نطاق واسع في الشركة (MOE).
يفتخر Qwen 2.5-Max بتدريب أكثر من 20 تريليون رموزًا وتصنيعًا من خلال التقنيات المتطورة مثل التثبيت الخاضع للإشراف (SFT) والتعلم التعزيز من التعليقات البشرية (RLHF).
مع وجود واجهة برمجة التطبيقات المتوفرة الآن من خلال Alibaba Cloud والنموذج الذي يمكن الوصول إليه للاستكشاف عبر Qwen Chat ، تقوم شركة Tech Tech العملاقة الصينية بدعوة المطورين والباحثين لرؤية اختراقاته مباشرة.
يتفوق على الأقران
عند مقارنة أداء QWEN 2.5-MAX مقابل بعض نماذج الذكاء الاصطناعي الأبرز في مجموعة متنوعة من المعايير ، فإن النتائج واعدة.
شملت التقييمات مقاييس شائعة مثل MMLU-PRO لحل المشكلات على مستوى الكلية ، و LiveCodeBench لخبرة الترميز ، و LiveBench للقدرات الشاملة ، و Arena Hard لتقييم النماذج ضد التفضيلات البشرية.
وفقًا لألبابا ، “يتفوق Qwen 2.5-Max على Deepseek V3 في معايير مثل Arena-Hard و LiveBench و LiveCodeBench و GPQA-Diamond ، مع إظهار النتائج التنافسية أيضًا في تقييمات أخرى ، بما في ذلك MMLU-Pro.”
يتنافس نموذج الإرشادات-المصمم للمهام المصب مثل الدردشة والترميز-مباشرة مع النماذج الرائدة مثل GPT-4O و Claude-3.5-Sonnet و Deepseek V3. من بين هؤلاء ، تمكنت Qwen 2.5-Max من التفوق على المنافسين في العديد من المجالات الرئيسية.
أسفرت مقارنات النماذج الأساسية أيضًا عن نتائج واعدة. بينما ظلت نماذج ملكية مثل GPT-4O و Claude-3.5-Sonnet بعيدة عن متناول ) ، و Qwen2.5-72b. مرة أخرى ، أظهر الوافد الجديد لأبابا أداءً استثنائياً في جميع المجالات.
“لقد أظهرت نماذجنا الأساسية مزايا كبيرة عبر معظم المعايير ،” صرحت علي بابا ، “ونحن متفائلون بأن التطورات في تقنيات ما بعد التدريب سترفع الإصدار التالي من QWEN 2.5-MAX إلى آفاق جديدة.”
جعل Qwen 2.5-Max يمكن الوصول إليه
لجعل النموذج أكثر سهولة للمجتمع العالمي ، قامت Alibaba بدمج QWEN 2.5-MAX مع منصة الدردشة QWEN الخاصة بها ، حيث يمكن للمستخدمين التفاعل مباشرة مع النموذج في قدرات مختلفة-سواء أكان استكشاف قدرات البحث أو اختبار فهمها للاستعلامات المعقدة.
للمطورين ، يتوفر الآن Qwen 2.5-Max API من خلال Alibaba Cloud تحت اسم النموذج “Qwen-Max-2025-01-25”. يمكن للمستخدمين المهتمين البدء عن طريق تسجيل حساب Alibaba Cloud ، وتفعيل خدمة استوديو النموذج ، وإنشاء مفتاح API.
API متوافق حتى مع النظام الإيكولوجي لـ Openai ، مما يجعل التكامل واضحًا للمشاريع الحالية وسير العمل. هذا التوافق يقلل من حاجز أولئك الذين يتوقون إلى اختبار تطبيقاتهم بقدرات النموذج.
قامت Alibaba ببيان نوايا قوي مع Qwen 2.5-Max. إن التزام الشركة المستمر بتوسيع نطاق نماذج الذكاء الاصطناعى لا يتعلق فقط بتحسين معايير الأداء ولكن أيضًا حول تعزيز القدرات الأساسية للتفكير والتفكير في هذه الأنظمة.
“إن تحجيم البيانات وحجم النموذج لا يعرض التقدم في الذكاء النموذجي فحسب ، بل يعكس أيضًا التزامنا الثابت بالأبحاث الرائدة”.
في المستقبل ، يهدف الفريق إلى دفع حدود تعلم التعزيز لتعزيز مهارات التفكير الأكثر تقدماً. ويقولون إن هذا يمكن أن يمكّن نماذجهم من المطابقة فحسب ، بل يتجاوز الذكاء البشري في حل المشكلات المعقدة.
الآثار المترتبة على الصناعة يمكن أن تكون عميقة. مع تحسن أساليب التحجيم وتراجع نماذج QWEN ، من المحتمل أن نرى المزيد من التموجات عبر حقول AI-GRAVENT على مستوى العالم والتي رأيناها في الأسابيع الأخيرة.
(تصوير مايكو أموريم)
انظر أيضا: تهدف حكومة ChatGPT إلى تحديث الوكالات الحكومية الأمريكية
هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الكبيرة من قادة الصناعة؟ تحقق من AI و Big Data Expo الذي يقام في أمستردام ، كاليفورنيا ، ولندن. تم تحديد الحدث الشامل مع الأحداث الرائدة الأخرى بما في ذلك مؤتمر الأتمتة الذكي ، و blockx ، وأسبوع التحول الرقمي ، ومعرض Cyber Security & Cloud.
استكشاف أحداث وندوات الويب القادمة الأخرى التي تعمل بها TechForge هنا.