أعلنت شركة Databricks عن إطلاق DBRX، وهو نموذج لغة كبير جديد قوي ومفتوح المصدر تدعي أنه يضع معيارًا جديدًا للنماذج المفتوحة من خلال التفوق على الخيارات القائمة مثل GPT-3.5 في معايير الصناعة.
تقول الشركة إن نموذج DBRX الذي يحتوي على 132 مليار معلمة يتفوق على دورات LLM الشهيرة مفتوحة المصدر مثل LLaMA 2 70B وMixtral وGrok-1 في فهم اللغة والبرمجة ومهام الرياضيات. حتى أنه يتفوق على نموذج Anthropic مغلق المصدر لكلود في معايير معينة.
أظهرت DBRX أداءً متطورًا بين النماذج المفتوحة في مهام البرمجة، متفوقة على النماذج المتخصصة مثل CodeLLaMA على الرغم من كونها ماجستير إدارة أعمال للأغراض العامة. كما أنها تطابقت أو تجاوزت GPT-3.5 عبر جميع المعايير التي تم تقييمها تقريبًا.
تأتي القدرات المتطورة بفضل بنية مزيج من الخبراء الأكثر كفاءة والتي تجعل DBRX أسرع بما يصل إلى 2x في الاستدلال من LLaMA 2 70B، على الرغم من وجود عدد أقل من المعلمات النشطة. تدعي Databricks أن تدريب النموذج كان أيضًا أكثر كفاءة في الحوسبة بحوالي 2x من البدائل الكثيفة.
قال علي قدسي، المؤسس المشارك والرئيس التنفيذي لشركة Databricks: “تضع DBRX معيارًا جديدًا لبرامج LLM مفتوحة المصدر – فهي تمنح المؤسسات منصة لبناء قدرات تفكير مخصصة بناءً على بياناتها الخاصة”.
تم تدريب DBRX مسبقًا على 12 تريليون رمز ضخم من النصوص وبيانات التعليمات البرمجية “المنسقة بعناية” والتي تم اختيارها لتحسين الجودة. إنه يستفيد من تقنيات مثل ترميز الموضع الدوار وتعلم المناهج الدراسية أثناء التدريب المسبق.
يمكن للعملاء التفاعل مع DBRX عبر واجهات برمجة التطبيقات أو استخدام أدوات الشركة لضبط النموذج على بيانات الملكية الخاصة بهم. لقد تم بالفعل دمجها في منتجات الذكاء الاصطناعي الخاصة بشركة Databricks.
قال ديف مينينجر، المدير التنفيذي لشركة Ventana Research، وهي جزء من ISG: “يُظهر بحثنا أن الشركات تخطط لإنفاق نصف ميزانيات الذكاء الاصطناعي الخاصة بها على الذكاء الاصطناعي التوليدي”. “أحد التحديات الثلاثة الكبرى التي يواجهونها هو أمن البيانات والخصوصية.
“من خلال منصة ذكاء البيانات الشاملة وإدخال DBRX، تعمل Databricks على تمكين المؤسسات من بناء تطبيقات ذكاء اصطناعي توليدية تكون محكومة وآمنة ومصممة خصيصًا لسياق أعمالهم، مع الحفاظ على السيطرة وملكية IP الخاصة بهم على طول طريق.”
أشاد الشركاء بما في ذلك Accenture، وBlock، وNasdaq، وProsus، وReplit، وZoom بقدرة DBRX على تسريع اعتماد المؤسسات لنماذج اللغات الكبيرة المفتوحة والمخصصة. قال المحللون إنها يمكن أن تؤدي إلى التحول من المصدر المفتوح إلى المصدر المفتوح حيث تتوافق النماذج المفتوحة المضبوطة بدقة مع أداء الملكية.
وعلق مايك أورورك، رئيس قسم الذكاء الاصطناعي وخدمات البيانات في بورصة ناسداك، قائلاً: “تعد Databricks شريكًا رئيسيًا لناسداك في بعض أنظمة البيانات الأكثر أهمية لدينا. إنهم لا يزالون في طليعة الصناعة في إدارة البيانات والاستفادة من الذكاء الاصطناعي، ونحن متحمسون لإصدار DBRX.
“إن الجمع بين أداء النموذج القوي واقتصاديات الخدمة المواتية هو نوع الابتكار الذي نبحث عنه بينما نعمل على تنمية استخدامنا للذكاء الاصطناعي التوليدي في ناسداك.”
يمكنك العثور على قاعدة DBRX والنماذج المضبوطة بدقة تعانق الوجه. المشاريع جيثب لديه المزيد من الموارد وأمثلة التعليمات البرمجية.
(تصوير رايان كوينتال)
أنظر أيضا: نماذج اللغة الكبيرة يمكن أن “تحدث ثورة في القطاع المالي في غضون عامين”
هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الضخمة من قادة الصناعة؟ اطلع على معرض الذكاء الاصطناعي والبيانات الضخمة الذي يقام في أمستردام وكاليفورنيا ولندن. ويقام هذا الحدث الشامل في مكان مشترك مع الأحداث الرائدة الأخرى بما في ذلك BlockX، وأسبوع التحول الرقمي، ومعرض الأمن السيبراني والسحابي.
استكشف الأحداث والندوات عبر الإنترنت القادمة الأخرى المتعلقة بتكنولوجيا المؤسسات والمدعومة من TechForge هنا.