أعلنت جوجل رسميًا إطلاق نظام الذكاء الاصطناعي متعدد الوسائط Gemini، الذي تنافس به الشركة نموذج GPT-4 من OpenAI.
ووفقًا لما ذكرته جوجل عبر مدونتها الرسمية، فإن نظامها الجديد صُمم ليكون متعدد الوسائط حيث جرى تدريبه على أنواع مختلفة من البيانات، ثم ضُبط باستخدام بيانات إضافية لتحسين فعاليته على نحو أكبر، مما يساعد Gemini على فهم كافة أنواع المدخلات والتفكير فيها بسلاسة، والجمع بين أنواع مختلفة من المعلومات، مثل النصوص والأكواد البرمجية والصوت والصورة والفيديو.
وقالت جوجل إن نظام Gemini سيأتي بثلاثة إصدارات مختلفة لتلبية الاحتياجات المتنوعة للمستخدمين، ويُعد إصدار “ألترا” أكبر تلك الإصدارات وأكثرها كفاءةً، وهو مصمم للمهام المعقدة، يليه إصدار “برو” الذي يمكن استخدامه على مجموعة من الأجهزة، ثم إصدار “نانو” للمهام الذي يمكن تنفيذها على جهاز واحد.
وفيما يتعلق بالأداء، زعمت جوجل أن إصدار ألترا من Gemini يتخطى 30 من أصل 32 معيارًا أكاديميًا لتقييم نماذج اللغات الكبيرة LLMs، كما ادعت أن Gemini يتفوق على النماذج المتعددة الوسائط الحالية، وفي مقدمتها نموذج GPT-4 من OpenAI في كافة معايير التقييم تقريبًا.
وقالت جوجل إنها عملت على إضافة المزيد من إجراءات السلامة للحد من المخاطر المحتملة مع القدرات المحسنة التي يتمتع بها النظام الجديد.
وبدأت جوجل طرح نظام الذكاء الاصطناعي في العديد من المنتجات، ومنها روبوت الدردشة الخاص بها “بارد Bard”، الذي سيعتمد على نسخة معدلة من إصدار برو، كما سيحصل هاتف بكسل 8 برو أيضًا على نموذج نانو لتنفيذ بعض المهام مثل التلخيص في تطبيق التسجيل الصوتي والرد الذكي في لوحة Gboard، كما ستضيف جوجل Gemini إلى تجربة البحث التوليدية التي أُطلقت حديثًا.
وقالت جوجل إنها ستؤجل إطلاق إصدار ألترا، لحاجته إلى المزيد من “فحوصات السلامة الواسعة النطاق”، لكنه سيكون متاحًا للتجربة المبكرة مطلع العام المقبل لبعض العملاء.
تابعنا