في مؤتمر APSARA في Hangzhou ، التي استضافتها Alibaba Cloud ، أكدت الشركات الناشئة في الصين من AI جهودها لتطوير نماذج لغوية كبيرة.
تتبع جهود الشركات الإعلان عن أحدث طراز LLMs من Openai ، بما في ذلك نموذج المحولات المسبق قبل التدريب O1 بدعم من Microsoft. يهدف هذا النموذج إلى معالجة المهام الصعبة ، ومهد الطريق للتقدم في العلوم والترميز والرياضيات.
خلال المؤتمر ، أكد كونال تشلين ، مؤسس Moonshot AI ، أهمية نموذج O1 ، مضيفًا أنه لديه القدرة على إعادة تشكيل مختلف الصناعات وخلق فرص جديدة للشركات الناشئة من الذكاء الاصطناعي.
صرح Zhilin أن التعلم التعزيز وقابلية التوسع قد يكون محوريًا لتطوير الذكاء الاصطناعي. تحدث عن قانون التحجيم ، الذي ينص على أن النماذج الأكبر التي تحتوي على المزيد من بيانات التدريب تعمل بشكل أفضل.
وقال تشيلين: “هذا النهج يدفع سقف قدرات الذكاء الاصطناعي” ، مضيفًا أن Openai O1 لديه القدرة على تعطيل القطاعات وتوليد فرص جديدة للشركات الناشئة.
أكد Openai أيضًا على قدرة النموذج على حل المشكلات المعقدة ، والتي تقول إنها تعمل بطريقة مشابهة للتفكير البشري. من خلال تحسين استراتيجياتها والتعلم من الأخطاء ، يحسن النموذج قدراته في حل المشكلات.
وقال Zhilin إن الشركات التي لديها ما يكفي من الطاقة الحوسبة ستكون قادرة على الابتكار ليس فقط في الخوارزميات ، ولكن أيضًا في نماذج الذكاء الاصطناعى التأسيسي. إنه يرى أن هذا محوري ، حيث يعتمد مهندسو AI بشكل متزايد على تعلم التعزيز لإنشاء بيانات جديدة بعد استنفاد مصادر البيانات العضوية المتاحة.
وافق الرئيس التنفيذي لشركة Stepfun Jiang Daxin مع Zhilin لكنه صرح أن القوة الحسابية لا تزال تمثل تحديًا كبيرًا للعديد من الشركات الناشئة ، لا سيما بسبب قيود التجارة الأمريكية التي تعيق الوصول إلى أشباه الموصلات المتقدمة.
“لا تزال المتطلبات الحسابية كبيرة” ، صرح داكسين.
قال أحد المطلعين في Baichuan AI أن مجموعة صغيرة فقط من الشركات الناشئة من الذكاء الاصطناعى الصينيين-بما في ذلك Moonshot AI ، و Baichuan AI ، و Zhipu AI ، و Minimax-في وضع يسمح لها بإجراء استثمارات واسعة النطاق في التعلم التعزيز. وتشارك هذه الشركات – التي يشار إليها مجتمعة باسم “النمور منظمة العفو الدولية” – بشكل كبير في تطوير LLM ، مما يدفع الجيل القادم من الذكاء الاصطناعي.
المزيد من مؤتمر Apsara
أيضًا في المؤتمر ، أصدرت Alibaba Cloud عدة إعلانات ، بما في ذلك إصدار عائلة Qwen 2.5 Model ، التي تتميز بالتطورات في الترميز والرياضيات. تتراوح النماذج بين 0.5 مليار إلى 72 مليار معلمة ودعم حوالي 29 لغة ، بما في ذلك الصينية والإنجليزية والفرنسية والإسبانية.
اكتسبت النماذج المتخصصة مثل QWEN2.5-COMER و QWEN2.5-math بالفعل بعض الجر ، مع أكثر من 40 مليون تنزيل على منصات تعانق الوجه والموديلات.
تمت إضافة Alibaba Cloud إلى محفظة منتجاتها ، حيث تقدم نموذجًا من نص إلى الفيديو في مولد الصور ، Tongyi Wanxiang. يمكن لهذا النموذج إنشاء مقاطع فيديو في أنماط واقعية ورسوم متحركة ، مع استخدامات محتملة في الإعلان وصناعة الأفلام.
كشفت Alibaba Cloud عن Qwen 2-VL ، أحدث إصدار من نموذج لغة الرؤية. إنه يتعامل مع مقاطع الفيديو لفترة أطول من 20 دقيقة ، ويدعم إجابة أسئلة قائمة على الفيديو ، ويتم تحسينها للأجهزة المحمولة والروبوتات.
لمزيد من المعلومات حول المؤتمر ، انقر هنا.
(تصوير: guy_ai_wise عبر x)
هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الكبيرة من قادة الصناعة؟ تحقق من AI و Big Data Expo الذي يقام في أمستردام ، كاليفورنيا ، ولندن. تم تحديد الحدث الشامل مع الأحداث الرائدة الأخرى بما في ذلك مؤتمر الأتمتة الذكي ، و blockx ، وأسبوع التحول الرقمي ، ومعرض Cyber Security & Cloud.
استكشاف أحداث وندوات الويب القادمة الأخرى التي تعمل بها TechForge هنا.