أعلنت شركة Mistral AI عن إطلاق NeMo، وهو نموذج 12B تم إنشاؤه بالشراكة مع NVIDIA. يتميز هذا النموذج الجديد بنافذة سياقية رائعة تصل إلى 128000 رمز ويزعم أنه يتمتع بأداء متطور في التفكير والمعرفة العالمية ودقة الترميز لفئته الحجمية.
لقد أدى التعاون بين Mistral AI وNVIDIA إلى ظهور نموذج لا يتخطى حدود الأداء فحسب، بل ويعطي الأولوية أيضًا لسهولة الاستخدام. تم تصميم Mistral NeMo ليكون بديلاً سلسًا للأنظمة التي تستخدم Mistral 7B حاليًا، وذلك بفضل اعتماده على البنية القياسية.
في خطوة لتشجيع التبني والمزيد من البحث، قامت Mistral AI بإتاحة نقاط تفتيش أساسية مُدرَّبة مسبقًا ونقاط تفتيش مُضبوطة بإرشادات بموجب ترخيص Apache 2.0. ومن المرجح أن يجذب هذا النهج مفتوح المصدر الباحثين والشركات على حد سواء، مما قد يؤدي إلى تسريع دمج النموذج في تطبيقات مختلفة.
من أهم مميزات Mistral NeMo قدرته على إدراك الكميات أثناء التدريب، مما يتيح استدلال FP8 دون المساس بالأداء. وقد تكون هذه القدرة بالغة الأهمية للمؤسسات التي تسعى إلى نشر نماذج لغوية كبيرة بكفاءة.
قدمت Mistral AI مقارنات أداء بين نموذج Mistral NeMo الأساسي ونموذجين مفتوحي المصدر تم تدريبهما مسبقًا: Gemma 2 9B و Llama 3 8B.
“تم تصميم النموذج للتطبيقات العالمية متعددة اللغات. تم تدريبه على استدعاء الوظيفة، ولديه نافذة سياق كبيرة، وهو قوي بشكل خاص في اللغات الإنجليزية والفرنسية والألمانية والإسبانية والإيطالية والبرتغالية والصينية واليابانية والكورية والعربية والهندية،” أوضحت Mistral AI.
“هذه خطوة جديدة نحو جلب نماذج الذكاء الاصطناعي الرائدة إلى أيدي الجميع بكل اللغات التي تشكل الثقافة الإنسانية.”
تقدم Mistral NeMo لعبة Tekken، وهي أداة جديدة تعتمد على Tiktoken. تم تدريب Tekken على أكثر من 100 لغة، وهي تقدم كفاءة ضغط محسنة لكل من النصوص الطبيعية ورمز المصدر مقارنة بأداة SentencePiece المستخدمة في نماذج Mistral السابقة. أفادت الشركة أن Tekken أكثر كفاءة بنحو 30% في ضغط رمز المصدر والعديد من اللغات الرئيسية، مع مكاسب أكبر في اللغة الكورية والعربية.
تزعم Mistral AI أيضًا أن Tekken يتفوق على Tokeniser Llama 3 في ضغط النص لحوالي 85% من جميع اللغات، مما يمنح Mistral NeMo أفضلية في التطبيقات متعددة اللغات.
أصبحت أوزان النموذج متاحة الآن على HuggingFace لكل من الإصدارين الأساسي والإرشادي. يمكن للمطورين البدء في تجربة Mistral NeMo باستخدام أداة mistral-inference وتكييفها مع mistral-finetune. بالنسبة لأولئك الذين يستخدمون منصة Mistral، يمكن الوصول إلى النموذج تحت اسم open-mistral-nemo.
في إشارة إلى التعاون مع NVIDIA، تم أيضًا توفير Mistral NeMo كخدمة استدلالية صغيرة من NVIDIA NIM، متاحة عبر ai.nvidia.com. يمكن أن يعمل هذا التكامل على تبسيط عملية النشر للمؤسسات التي استثمرت بالفعل في نظام الذكاء الاصطناعي التابع لـ NVIDIA.
يمثل إصدار Mistral NeMo خطوة مهمة إلى الأمام في إضفاء الطابع الديمقراطي على نماذج الذكاء الاصطناعي المتقدمة. من خلال الجمع بين الأداء العالي والقدرات المتعددة اللغات والتوافر مفتوح المصدر، تعمل Mistral AI وNVIDIA على وضع هذا النموذج كأداة متعددة الاستخدامات لمجموعة واسعة من تطبيقات الذكاء الاصطناعي عبر مختلف الصناعات ومجالات البحث.
(تصوير ديفيد كلود)
أنظر أيضا: انضمت Meta إلى Apple في حجب نماذج الذكاء الاصطناعي عن مستخدمي الاتحاد الأوروبي
هل تريد أن تتعلم المزيد عن الذكاء الاصطناعي والبيانات الضخمة من قادة الصناعة؟ تعرف على معرض الذكاء الاصطناعي والبيانات الضخمة الذي يقام في أمستردام وكاليفورنيا ولندن. يقام هذا الحدث الشامل بالتزامن مع فعاليات رائدة أخرى بما في ذلك مؤتمر الأتمتة الذكية، وBlockX، وأسبوع التحول الرقمي، ومعرض الأمن السيبراني والسحابة.
استكشف الأحداث والندوات عبر الإنترنت الأخرى المتعلقة بتكنولوجيا المؤسسات والتي تدعمها TechForge هنا.