لطالما واجهت اللغة العربية تحديات في مجال تطوير نماذج الذكاء الاصطناعي، ليس بسبب طبيعة اللغة نفسها، بل نتيجةً لنقص البيانات عالية الجودة وتشتتها، واعتماد معظم النماذج العالمية على أساليب لا تراعي الخصائص اللغوية والثقافية الفريدة للعربية. لكن مع إطلاق نموذج (جيس 2)، يشهد هذا المشهد تحولًا ملحوظًا، حيث يضع هذا النموذج الأساس لتقدم الذكاء الاصطناعي الناطق بالعربية نحو مكانة أكثر تأثيرًا وتنافسية على الساحة العالمية.
شهد القطاع التقني في المنطقة العربية الأسبوع الماضي حدثًا تاريخيًا، وهو إطلاق (جيس 2) Jais 2، وهو نموذج لغوي عربي كبير مفتوح الوزن ويعتبر الأكثر تطورًا على مستوى العالم حتى الآن. لم يكن هذا الإطلاق مجرد تحديث تقني، بل إعلانًا عن تغيير جوهري في مكانة اللغة العربية ضمن منظومة الذكاء الاصطناعي العالمية.
تم تحقيق هذا الإنجاز من خلال تعاون استراتيجي بين شركة (إنسيبشن) Inception التابعة لمجموعة (جي42) الإماراتية، وشركة (سيريبراس سيستمز) Cerebras Systems، ومعهد النماذج التأسيسية في جامعة محمد بن زايد للذكاء الاصطناعي.
السؤال المطروح الآن: لماذا يمثل (جيس 2) نقطة تحول رئيسية في مسيرة الذكاء الاصطناعي العربي، وما الذي يميز هذا الإنجاز عن سابقيه؟
يكمن الجواب في خمسة أبعاد أساسية، تعمل على نقل المنطقة من مرحلة التكيف مع نماذج الذكاء الاصطناعي العالمية إلى مرحلة الريادة في تطوير النماذج العربية، وتشمل:
أولًا؛ البناء من الصفر.. نهاية حقبة التعريب السطحي:
لا تكمن قوة نموذج (جيس 2) في حجمه فحسب، بل في فلسفة بنائه. فقد تم تطويره من الصفر باستخدام 70 مليار مُعامل متغير، وليس مجرد تعديل أو تعريب لنموذج أجنبي موجود.
كما تم تدريب النموذج على أكبر قاعدة بيانات عربية المنشأ حتى الآن، مما عالج مشكلة تاريخية في تطوير النماذج العربية وهي ندرة البيانات النظيفة والمتوازنة والمتوافقة ثقافيًا. ويعني هذا التحول أن اللغة العربية لم تعد مجرد إضافة لغوية إلى نموذج عالمي، بل أصبحت هي اللغة الأساسية التي انطلقت منها عملية التصميم والتدريب.
ثانيًا؛ العربية كما تُستخدم لا كما تُدرَّس.. فهم أعمق للواقع:
ما يميز نموذج (جيس 2) هو تعامله مع اللغة العربية كلغة حية، تُمارَس يوميًا، وليس مجرد نص معياري جامد. لم يقتصر تدريب النموذج على الفصحى الكلاسيكية، بل شمل اللهجات الإقليمية، والتناوب اللغوي بين العربية والإنجليزية، والأساليب غير الرسمية، ولغة منصات التواصل الاجتماعي.
أظهر النموذج قدرة ملحوظة على الانتقال بين الفصحى واللهجات، وأداءً قويًا عبر مجموعة واسعة من المحتوى، بدءًا من الشعر العربي والثقافة، وصولًا إلى الخطاب الرقمي المعاصر. ومع هيكلية مُعاد تصميمها وبيانات أكثر تنظيمًا ونقاءً، برزت قدراته المتقدمة في الفهم السياقي والاستدلال، مما يعكس العربية كما تُستخدم في المحادثات اليومية.
ثالثًا: أداء عالمي بكفاءة حاسوبية غير مسبوقة:
يتميز النموذج بكفاءة تدريبية مبتكرة، حيث تم تدريبه باستخدام أنظمة (سيريبراس سيستمز)، مما مكنه من تحقيق أداء يضاهي النماذج العالمية الرائدة، ولكن باستخدام جزء محدود فقط من الموارد الحاسوبية المطلوبة عادةً للنماذج المماثلة.
لا يقتصر هذا البعد على التفوق التقني، بل يحمل أهمية استراتيجية تتعلق بإمكانية توسيع نطاق النماذج العربية دون الحاجة إلى موارد حاسوبية ضخمة، وهو عامل حاسم في استدامة الابتكار في مجال الذكاء الاصطناعي.
ماذا يعني أن نموذج (جيس 2) مفتوح الوزن؟
تُشير كلمة الأوزان (Weights) في سياق الذكاء الاصطناعي إلى القيم الرياضية والمعاملات التي اكتسبها النموذج خلال عملية التدريب. هذه الأوزان تحدد العلاقة بين المدخلات والمخرجات، وهي جوهر النموذج الذي يمكّنه من الفهم والتحليل والإجابة.
عندما يُقال إن نموذجًا ما (مفتوح الوزن)، فهذا يعني أن الشركة المطورة قد أتاحت ملفات الأوزان النهائية للنموذج للباحثين والمطورين، مما يتيح لهم تحميله وتشغيله وتخصيصه والبناء عليه وفقًا لاحتياجاتهم المختلفة، بدلًا من الاكتفاء باستخدامه عبر واجهات مغلقة أو خدمات سحابية محدودة.
رابعًا؛ نموذج مفتوح الوزن.. وتحول في فلسفة التطوير:
إن إتاحة (جيس 2) كنموذج مفتوح الوزن عبر منصة (Hugging Face) والموقع الرسمي يمثل تحولًا في فلسفة تطوير الذكاء الاصطناعي العربي، من نماذج مغلقة ومحدودة الاستخدام إلى منظومة مفتوحة تمكن الباحثين من تعميق الدراسات اللغوية، والمطورين من بناء تطبيقات ذكية محلية، والشركات الناشئة من الابتكار دون عوائق. ويعزز هذا الانفتاح من تراكم المعرفة ويؤسس لمنظومة تقنية قابلة للنمو والتطور.
خامسًا؛ السلامة والتوافق الثقافي في قلب التصميم:
على عكس العديد من النماذج العالمية، التي تُضاف إليها إجراءات السلامة في مراحل لاحقة، يدمج (جيس 2) إطارًا شاملاً للسلامة منذ مرحلة التصميم الأولى، ويعتمد هذا الإطار على ضبط التعليمات والتقييم المستمر والاستفادة من ردود المستخدمين.
بالإضافة إلى ذلك، لا ينفصل هذا الإطار عن التوافق الثقافي، مما يجعل النموذج أكثر موثوقية وقدرة على التكيف مع السياقات الاجتماعية العربية.
تتجاوز قيمة (جيس 2) حدود التقنية لتشمل تعزيز السيادة الرقمية واللغوية، وتحفيز التحول الرقمي الشامل، وفتح آفاق الاقتصاد المعرفي العربي. يمثل هذا النموذج درعًا لحماية الهوية الرقمية العربية، ومنح المنطقة أدواتها الخاصة لتطوير الذكاء الاصطناعي دون الاعتماد الكلي على نماذج عالمية قد لا تتوافق ثقافيًا أو لغويًا.
ومن ثم، لا يُعد (جيس 2) مجرد إنجاز تقني متقدم، بل هو إعادة تموضع استراتيجي حاسم للغة العربية والثقافة الناطقة بها داخل المشهد العالمي للذكاء الاصطناعي، ليتحول من لغة مستهلكة للتقنية إلى لغة منتجة ومُحركة لها.
