أصدر فريق Qwen من Alibaba للتو نسخة جديدة من نموذج الذكاء الاصطناعي المفتوح المصدر مع بعض المعايير المثيرة للإعجاب.
تلبية QWEN3-235B-A22B-THEOKENT-2507. على مدار الأشهر الثلاثة الماضية ، كان فريق Qwen يعمل بجد يعمل على زيادة ما يسمونه “القدرة على التفكير” لمنظمة العفو الدولية الخاصة بهم ، بهدف تحسين جودة وعمق تفكيرها.
نتيجة جهودهم هي نموذج يتفوق على الأشياء الصعبة حقًا: التفكير المنطقي ، والرياضيات المعقدة ، ومشاكل العلوم ، والترميز المتقدم. في هذه المجالات التي تتطلب عادةً خبيرًا بشريًا ، يحدد نموذج QWEN الجديد هذا المعيار المعيار لنماذج المصدر المفتوح.
عند معايير التفكير ، يحقق أحدث طراز AI من QWEN المصدر 92.3 على AIME25 و 74.1 على LiveCodeBench V6 للترميز. كما أنه يحتفظ باختبارات قدرته بشكل عام ، حيث سجل 79.7 على Arena-Hard V2 ، والذي يقيس مدى توافقه مع التفضيلات البشرية.
في قلبه ، هذا نموذج من الذكاء الاصطناعى المنطقي من فريق Qwen مع إجمالي 235 مليار معلمة. ومع ذلك ، فإنه يستخدم الخبرة في خليط (MOE) ، مما يعني أنه ينشط جزءًا صغيرًا فقط من تلك المعلمات-حوالي 22 مليار-في وقت واحد. فكر في الأمر مثل وجود فريق ضخم من 128 متخصصًا في الاتصال ، ولكن يتم إحضار فقط الثمانية الأكثر ملاءمة لمهمة محددة للعمل عليها بالفعل.
ربما واحدة من أكثر ميزاتها إثارة للإعجاب هي ذاكرتها الضخمة. نموذج Qwen Open Source Ai-AI لديه طول سياق أصلي يبلغ 262،144 رمزًا ؛ ميزة كبيرة للمهام التي تنطوي على فهم كميات هائلة من المعلومات.
للمطورين والعبثين هناك ، جعل فريق Qwen من السهل البدء. النموذج متاح على معانقة الوجه. يمكنك نشره باستخدام أدوات مثل SGLANG أو VLLM لإنشاء نقطة نهاية API الخاصة بك. يشير الفريق أيضًا إلى إطار عمل QWEN-Agent كأفضل طريقة للاستفادة من مهارات وضع أدوات النموذج.
للحصول على أفضل أداء من نموذج التفكير في AI مفتوح المصدر ، شارك فريق QWEN بعض النصائح. يقترحون طول الإخراج حوالي 32،768 رمزًا لمعظم المهام ، ولكن لتحديات معقدة حقًا ، يجب أن تعزز ذلك إلى 81،920 رمزًا لإعطاء مساحة كافية “للتفكير”. يوصيون أيضًا بإعطاء تعليمات محددة للنموذج في مطالبك ، مثل مطالبة “بالتسبب في خطوة بخطوة” لمشاكل الرياضيات ، للحصول على الإجابات الأكثر دقة ومنظمة.
يوفر إصدار نموذج QWEN الجديد هذا المنطق القوي المنطقي المصدر الذي يمكن أن ينافس بعضًا من أفضل النماذج ذات الملكية ، خاصة عندما يتعلق الأمر بالمهام المعقدة والانحناء في الدماغ. سيكون من المثير رؤية ما يبنيه المطورون في النهاية.
(صورة من تونغ لام)
انظر أيضا: خطة عمل الذكاء الاصطناعى: يجب أن تكون القيادة الأمريكية “غير محددة”

هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الكبيرة من قادة الصناعة؟ تحقق من AI و Big Data Expo الذي يقام في أمستردام ، كاليفورنيا ، ولندن. تم تحديد الحدث الشامل مع الأحداث الرائدة الأخرى بما في ذلك مؤتمر الأتمتة الذكي ، و blockx ، وأسبوع التحول الرقمي ، ومعرض Cyber Security & Cloud.
استكشاف أحداث وندوات الويب الأخرى القادمة التي تعمل بها TechForge هنا.