Close Menu
تقنية نيوزتقنية نيوز

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    مقالات قد تهمك

    يبدو أن مشكلات VPN على هاتفك هي خطأ لم يتم إصلاحه في Android 16

    19 مارس, 2026

    تقدم Mint Mobile هواتف Samsung Galaxy S26 بخصومات تصل إلى 600 دولار.

    19 مارس, 2026

    تقدم أمازون أنماط دردشة جديدة لـ Alexa+، وقد يكون أحدها ساخرًا.

    19 مارس, 2026
    فيسبوك X (Twitter) الانستغرام
    • من نحن
    • سياسة الخصوصية
    • اتصل بنا
    فيسبوك X (Twitter) الانستغرام يوتيوب
    تقنية نيوزتقنية نيوز
    • الرئيسية
    • اخر الاخبار
    • هواتف ذكية
    • كمبيوتر
    • برامج وتطبيقات
    • شركات
      • ابل
      • سامسونج
      • جوجل
      • مايكروسوفت
      • أمازون
    • المزيد
      • الذكاء الإصطناعي
      • الأمن الإلكتروني
      • ألعاب
      • منوعات تقنية
    اشترك معنا
    تقنية نيوزتقنية نيوز
    الرئيسية » Alibaba Qwen QWQ-32B: عرض التعلم التعزيز المقلي
    الذكاء الإصطناعي

    Alibaba Qwen QWQ-32B: عرض التعلم التعزيز المقلي

    فريق التحريربواسطة فريق التحرير6 مارس, 20250 زيارةلا توجد تعليقات
    شاركها فيسبوك تويتر بينتيريست لينكدإن Tumblr رديت تيلقرام البريد الإلكتروني
    شاركها
    فيسبوك تويتر لينكدإن بينتيريست البريد الإلكتروني

    كشف فريق QWEN في Alibaba عن QWQ-32B ، وهو نموذج AI معلمة 32 مليار الذي يوضح أداء Deepseek-R1 أكبر بكثير. يسلط هذا الاختراق الضوء على إمكانات التعلم التعزيز (RL) على نماذج الأساس القوية.

    نجح فريق QWEN في دمج قدرات الوكيل في نموذج التفكير ، مما يتيح له التفكير بشكل نقدي ، واستخدام الأدوات ، وتكييف تفكيره بناءً على ردود الفعل البيئية.

    “تحجيم RL لديه القدرة على تعزيز أداء النموذج بما يتجاوز أساليب ما قبل التدريب التقليدية وما بعد التدريب” ، صرح الفريق. “لقد أظهرت الدراسات الحديثة أن RL يمكن أن يحسن بشكل كبير قدرات التفكير في النماذج.”

    يحقق QWQ-32B أداءً مماثلًا لـ Deepseek-R1 ، والذي يضم 671 مليار معلمة (بتنشيط 37 مليار) ، وهو شهادة على فعالية RL عند تطبيقها على نماذج أساس قوية تم تجهيزها على المعرفة العالمية الواسعة. تؤكد هذه النتيجة الرائعة على إمكانات RL لسد الفجوة بين حجم النموذج والأداء.

    تم تقييم النموذج عبر مجموعة من المعايير ، بما في ذلك AIME24 و LiveCodeBench و LiveBench و Ifeval و BFCL ، المصممة لتقييم التفكير الرياضي ، وكفاءة الترميز ، وقدرات حل المشكلات العامة.

    تسلط النتائج الضوء على أداء QWQ-32B مقارنة بالنماذج الرائدة الأخرى ، بما في ذلك Deepseek-R1-Dewen-32b ، و Deepseek-R1-Dreilled-LALAMA-70B ، و O1-MINI ، و DEEPSEEK-R1 الأصلي.

    النتائج القياسية:

    • AIME24: حقق QWQ-32B 79.5 ، خلف Deepseek-R1-6718’s 79.8 ، ولكن قبل أن يكون Openal-O1-Mini's 63.6 ونماذج مقطرة.
    • LiveCodeBench: سجل QWQ-32B 63.4 ، مرة أخرى عن كثب من قبل Deepseek-R1-6718's 65.9 ، وتجاوز النماذج المقطرة و 53.8 Openal-O1-Mini.
    • LiveBench: حقق QWQ-32B 73.1 ، مع تسجيل Deepseek-R1-6718 71.6 ، وتفوق على النماذج المقطرة و 57.5 Openal-O1-Mini.
    • ifeval: سجل QWQ-32B 83.9 ، بالقرب من Deepseek-R1-6718 83.3 ، وقيادة النماذج المقطرة و 59.1 Openal-O1-Mini.
    • BFCL: حقق QWQ-32B 66.4 ، مع تسجيل Deepseek-R1-6718 62.8 ، مما يدل على الرصاص على النماذج المقطرة و 49.3 Openal-O1-Mini.

    تضمنت نهج فريق Qwen نقطة تفتيش بارد وعملية RL متعددة المراحل مدفوعة بالمكافآت القائمة على النتائج. ركزت المرحلة الأولية على توسيع نطاق RL لمهام الرياضيات والترميز ، مع استخدام التحقق من الدقة وخوادم تنفيذ التعليمات البرمجية. توسعت المرحلة الثانية لتشمل القدرات العامة ، ودمج المكافآت من نماذج المكافآت العامة والتحققات القائمة على القواعد.

    “نجد أن هذه المرحلة من تدريب RL مع كمية صغيرة من الخطوات يمكن أن تزيد من أداء القدرات العامة الأخرى ، مثل التعليمات التالية ، والتوافق مع التفضيل البشري ، وأداء الوكيل ، دون انخفاض كبير في الأداء في الرياضيات والترميز” ، أوضح الفريق.

    QWQ-32B مفتوح الوزن ومتوفر على Hugging Face و ModelsCope بموجب ترخيص Apache 2.0 ، ويمكن الوصول إليه أيضًا عبر Qwen Chat. ينظر فريق QWEN إلى هذا على أنه خطوة أولية في تحجيم RL لتعزيز قدرات التفكير ويهدف إلى زيادة استكشاف تكامل الوكلاء مع RL للتفكير الطويل الأفق.

    “بينما نعمل على تطوير الجيل القادم من QWEN ، نحن واثقون من أن الجمع بين نماذج الأساس الأقوى مع RL التي تعمل بالموارد الحسابية المقيدة سيؤكدنا من تحقيق الذكاء العام الاصطناعي (AGI) ،” قال الفريق.

    انظر أيضا: Deepgram Nova-3 Medical: نموذج الكلام من الذكاء الاصطناعي يقطع أخطاء نسخ الرعاية الصحية

    هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الكبيرة من قادة الصناعة؟ تحقق من AI و Big Data Expo الذي يقام في أمستردام ، كاليفورنيا ، ولندن. تم تحديد الحدث الشامل مع الأحداث الرائدة الأخرى بما في ذلك مؤتمر الأتمتة الذكي ، و blockx ، وأسبوع التحول الرقمي ، ومعرض Cyber ​​Security & Cloud.

    استكشاف أحداث وندوات الويب الأخرى القادمة التي تعمل بها TechForge هنا.

    شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr البريد الإلكتروني
    السابقمعدل شهير ينقذ لعبة Monster Hunter Wilds قبل شركة كابكوم بحل مشاكلها التقنية!
    التالي تم تعيين عرض سماعات رأس Samsung XR على الذهاب إلى أخمص القدمين مع Apple Vision Pro

    المقالات ذات الصلة

    الذكاء الإصطناعي

    يواجه كلود تقطير نموذج الذكاء الاصطناعي “على المستوى الصناعي”.

    26 فبراير, 2026
    الذكاء الإصطناعي

    نوكيا وأمازون ويب سيرفيسز تجربان أتمتة الذكاء الاصطناعي لتقطيع شبكات الجيل الخامس (5G).

    25 فبراير, 2026
    الذكاء الإصطناعي

    استكشاف الذكاء الاصطناعي في قطاع البيع بالتجزئة بآسيا والمحيط الهادئ.

    22 فبراير, 2026
    الذكاء الإصطناعي

    كيف تدمج المؤسسات المالية الذكاء الاصطناعي في عمليات اتخاذ القرار.

    19 فبراير, 2026
    الذكاء الإصطناعي

    يكشف (Murder Mystery 2) عن سلوك ناشئ للاعبين عبر الإنترنت.

    15 فبراير, 2026
    الذكاء الإصطناعي

    يستهدف نموذج تنبؤ بالذكاء الاصطناعي تحسين كفاءة موارد الرعاية الصحية.

    15 فبراير, 2026
    الذكاء الإصطناعي

    يقود الذكاء الاصطناعي التوكيلي (Agentic AI) العائد على الاستثمار المالي في أتمتة الحسابات الدائنة.

    13 فبراير, 2026
    الذكاء الإصطناعي

    قراصنة مدعومون من دول يستغلون الذكاء الاصطناعي في هجمات سيبرانية: جوجل.

    12 فبراير, 2026
    الذكاء الإصطناعي

    كيف يفصل المنطق والبحث عن تعزيز قابلية التوسع لعامل الذكاء الاصطناعي.

    9 فبراير, 2026
    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    Demo
    اخر الاخبار

    مقارنة بين Samsung Galaxy Z Fold 6 و Galaxy S24 Ultra: لا تخطئ

    25 يوليو, 20241٬182 زيارة

    سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

    4 يوليو, 2024825 زيارة

    يحصل iPhone على أول تطبيق إباحي أصلي له

    4 فبراير, 2025818 زيارة

    كل ما تريد معرفته عن Reacher الموسم الثالث

    6 مايو, 2024784 زيارة

    Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

    2 أبريل, 2024725 زيارة

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    رائج الآن
    ألعاب

    رسمياً: يمكنك لعب GTA Online مجانًا الآن على جميع المنصات المنزلية

    فريق التحرير11 نوفمبر, 2025
    منوعات تقنية

    استخدم chatgpt بالعربي مجانا بدون تسجيل

    فريق التحرير29 مايو, 2025
    ألعاب

    يمكنك الآن لعب Resident Evil الأصلية على جهاز الكمبيوتر بكل مجدها القديم

    فريق التحرير26 يونيو, 2024
    رائج الآن

    رسمياً: يمكنك لعب GTA Online مجانًا الآن على جميع المنصات المنزلية

    11 نوفمبر, 202510 زيارة

    استخدم chatgpt بالعربي مجانا بدون تسجيل

    29 مايو, 202510 زيارة

    يمكنك الآن لعب Resident Evil الأصلية على جهاز الكمبيوتر بكل مجدها القديم

    26 يونيو, 202410 زيارة
    اختيارات المحرر

    يبدو أن مشكلات VPN على هاتفك هي خطأ لم يتم إصلاحه في Android 16

    19 مارس, 2026

    تقدم Mint Mobile هواتف Samsung Galaxy S26 بخصومات تصل إلى 600 دولار.

    19 مارس, 2026

    تقدم أمازون أنماط دردشة جديدة لـ Alexa+، وقد يكون أحدها ساخرًا.

    19 مارس, 2026

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    تقنية نيوز
    فيسبوك X (Twitter) الانستغرام يوتيوب لينكدإن تيكتوك
    • الرئيسية
    • سياسة الخصوصية
    • من نحن
    • اتصل بنا
    © 2026 تقنية نيوز. جميع حقوق النشر محفوظة.

    اكتب كلمة البحث ثم اضغط على زر Enter