كشف فريق Qwen التابع لشركة Alibaba Cloud عن Qwen2-Math، وهي سلسلة من نماذج اللغة الكبيرة المصممة خصيصًا لمعالجة المشكلات الرياضية المعقدة.
وتظهر هذه النماذج الجديدة – المبنية على أساس Qwen2 الحالي – كفاءة ملحوظة في حل التحديات الحسابية والرياضية، وتتفوق على قادة الصناعة السابقين.
قام فريق Qwen بتصميم Qwen2-Math باستخدام مجموعة كبيرة ومتنوعة من الموارد المخصصة للرياضيات. تتألف هذه المجموعة من نسيج غني من الموارد عالية الجودة، بما في ذلك نصوص الويب والكتب والأكواد وأسئلة الامتحانات والبيانات الاصطناعية التي تم إنشاؤها بواسطة Qwen2 نفسها.
وقد كشف التقييم الدقيق للمعايير الرياضية باللغتين الإنجليزية والصينية – بما في ذلك GSM8K وMath وMMLU-STEM وCMATH وGaoKao Math – عن القدرات الاستثنائية لـ Qwen2-Math. والجدير بالذكر أن النموذج الرائد، Qwen2-Math-72B-Instruct، تجاوز أداء النماذج الملكية مثل GPT-4o وClaude 3.5 في مهام رياضية مختلفة.
وأشار فريق Qwen إلى أن “Qwen2-Math-Instruct يحقق أفضل أداء بين النماذج من نفس الحجم، مع تفوق RM@8 على Maj@8، وخاصة في نماذج 1.5B و7B”.
ويعود هذا الأداء المتفوق إلى التنفيذ الفعال لنموذج المكافأة الخاص بالرياضيات أثناء عملية التطوير.
وفي إطار إظهار قدراتها بشكل أكبر، أظهرت Qwen2-Math نتائج مذهلة في المسابقات الرياضية الصعبة مثل امتحان الرياضيات الأمريكي (AIME) 2024 ومسابقة الرياضيات الأمريكية (AMC) 2023.
ولضمان سلامة النموذج ومنع التلوث، نفذ فريق Qwen أساليب إزالة التلوث القوية أثناء مرحلتي ما قبل التدريب وما بعده. وتضمن هذا النهج الصارم إزالة العينات المكررة وتحديد التداخلات مع مجموعات الاختبار للحفاظ على دقة النموذج وموثوقيته.
في المستقبل، يخطط فريق Qwen لتوسيع قدرات Qwen2-Math إلى ما هو أبعد من اللغة الإنجليزية، مع نماذج ثنائية اللغة ومتعددة اللغات قيد الإعداد. ويهدف هذا الالتزام بالشمول إلى جعل حل المشكلات الرياضية المتقدمة في متناول الجمهور العالمي.
وأكد فريق كوين: “سنواصل تعزيز قدرة نماذجنا على حل المشكلات الرياضية المعقدة والصعبة”.
يمكنك العثور على موديلات Qwen2 على Hugging Face هنا.
انظر أيضا: بايج ومايكروسوفت تكشفان عن نماذج الذكاء الاصطناعي من الجيل القادم لتشخيص السرطان
هل تريد أن تتعلم المزيد عن الذكاء الاصطناعي والبيانات الضخمة من قادة الصناعة؟ تعرف على معرض الذكاء الاصطناعي والبيانات الضخمة الذي يقام في أمستردام وكاليفورنيا ولندن. يقام هذا الحدث الشامل بالتزامن مع فعاليات رائدة أخرى بما في ذلك مؤتمر الأتمتة الذكية، وBlockX، وأسبوع التحول الرقمي، ومعرض الأمن السيبراني والسحابة.
استكشف الأحداث والندوات عبر الإنترنت الأخرى المتعلقة بتكنولوجيا المؤسسات والتي تدعمها TechForge هنا.