أعلن الرئيس التنفيذي لشركة Google، ساندر بيتشاي، عن إطلاق Gemini 2.0، وهو نموذج يمثل الخطوة التالية في طموح Google لإحداث ثورة في الذكاء الاصطناعي.
بعد مرور عام على تقديم نموذج Gemini 1.0، تشتمل هذه الترقية الرئيسية على إمكانات محسنة متعددة الوسائط ووظائف وكيلة وأدوات مستخدم مبتكرة مصممة لتجاوز الحدود في التكنولوجيا التي تعتمد على الذكاء الاصطناعي.
القفز نحو الذكاء الاصطناعي التحويلي
وفي معرض تعليقه على مهمة Google التي استمرت 26 عامًا لتنظيم المعلومات حول العالم وإتاحتها، قال بيتشاي: “إذا كان Gemini 1.0 يدور حول تنظيم المعلومات وفهمها، فإن Gemini 2.0 يدور حول جعلها أكثر فائدة.”
كان Gemini 1.0، الذي تم إصداره في ديسمبر 2022، معروفًا بكونه أول نموذج ذكاء اصطناعي متعدد الوسائط من Google. برع التكرار الأول في فهم ومعالجة النصوص والفيديو والصور والصوت والتعليمات البرمجية. لقد أصبح الإصدار 1.5 المحسن الخاص به معتمدًا على نطاق واسع من قبل المطورين لفهمه للسياق الطويل، مما يتيح تطبيقات مثل NotebookLM التي تركز على الإنتاجية.
الآن، مع Gemini 2.0، تهدف Google إلى تسريع دور الذكاء الاصطناعي كمساعد عالمي قادر على توليد الصور والصوت الأصلي، وتحسين التفكير والتخطيط، وقدرات اتخاذ القرار في العالم الحقيقي. وعلى حد تعبير بيتشاي، فإن هذا التطوير يمثل فجر “عصر الوكلاء”.
وأوضح بيتشاي: “لقد استثمرنا في تطوير المزيد من النماذج الفاعلية، مما يعني أنه يمكنهم فهم المزيد عن العالم من حولك، والتفكير في خطوات متعددة للأمام، واتخاذ الإجراءات نيابة عنك، تحت إشرافك”.
الجوزاء 2.0: الميزات الأساسية والتوافر
في قلب إعلان اليوم يوجد الإصدار التجريبي لـ Gemini 2.0 Flash، النموذج الرئيسي للجيل الثاني من Gemini. إنه يعتمد على الأسس التي أرساها أسلافه مع توفير أوقات استجابة أسرع وأداء متقدم.
يدعم Gemini 2.0 Flash المدخلات والمخرجات متعددة الوسائط، بما في ذلك القدرة على إنشاء صور أصلية بالتزامن مع النص وإنتاج صوت متعدد اللغات قابل للتوجيه من النص إلى كلام. بالإضافة إلى ذلك، يمكن للمستخدمين الاستفادة من تكامل الأدوات الأصلية مثل بحث Google وحتى الوظائف المحددة من قبل المستخدم التابع لجهات خارجية.
سيتمكن المطورون والشركات من الوصول إلى Gemini 2.0 Flash عبر Gemini API في Google AI Studio وVertex AI، بينما من المقرر إصدار أحجام نماذج أكبر على نطاق أوسع في يناير 2024.
من أجل إمكانية الوصول العالمية، يتميز تطبيق Gemini الآن بإصدار محسّن للدردشة من نموذج Flash التجريبي 2.0. يمكن للمستخدمين الأوائل تجربة هذا المساعد المحدث على سطح المكتب والهاتف المحمول، مع طرح تطبيق الهاتف المحمول وشيكًا.
يتم أيضًا تحسين منتجات مثل بحث Google باستخدام Gemini 2.0، مما يفتح القدرة على التعامل مع الاستعلامات المعقدة مثل مسائل الرياضيات المتقدمة، واستعلامات الترميز، والأسئلة متعددة الوسائط.
مجموعة شاملة من ابتكارات الذكاء الاصطناعي
يأتي إطلاق Gemini 2.0 مزودًا بأدوات جديدة مقنعة تعرض قدراته.
إحدى هذه الميزات، Deep Research، تعمل كمساعد أبحاث الذكاء الاصطناعي، مما يبسط عملية التحقيق في الموضوعات المعقدة من خلال تجميع المعلومات في تقارير شاملة. تعمل ترقية أخرى على تحسين البحث من خلال مراجعات الذكاء الاصطناعي الممكّنة لـ Gemini والتي تعالج استعلامات المستخدم المعقدة والمتعددة الخطوات.
تم تدريب النموذج باستخدام وحدات معالجة Tensor (TPUs) من الجيل السادس من Google، والمعروفة باسم Trillium، والتي يشير بيتشاي إلى أنها “دعمت 100% من تدريب واستدلال Gemini 2.0”.
أصبح Trillium متاحًا الآن للمطورين الخارجيين، مما يسمح لهم بالاستفادة من نفس البنية الأساسية التي تدعم تطورات Google الخاصة.
تجارب وكيلة رائدة
تصاحب Gemini 2.0 نماذج تجريبية “وكيلة” تم تصميمها لاستكشاف مستقبل التعاون بين الإنسان والذكاء الاصطناعي، بما في ذلك:
- مشروع أسترا: مساعد الذكاء الاصطناعي العالمي
تم تقديم Project Astra لأول مرة في I/O في وقت سابق من هذا العام، وهو يستفيد من فهم Gemini 2.0 متعدد الوسائط لتحسين تفاعلات الذكاء الاصطناعي في العالم الحقيقي. قام المختبرون الموثوقون بتجربة المساعد على Android، وقدموا تعليقات ساعدت في تحسين الحوار متعدد اللغات، والاحتفاظ بالذاكرة، والتكامل مع أدوات Google مثل البحث، وLens، والخرائط. وقد أظهرت Astra أيضًا زمن استجابة للمحادثة يقترب من الإنسان، مع إجراء المزيد من الأبحاث لتطبيقها في التكنولوجيا القابلة للارتداء، مثل النموذج الأولي لنظارات الذكاء الاصطناعي.
- مشروع مارينر: إعادة تعريف أتمتة الويب
Project Mariner هو مساعد تجريبي لتصفح الويب يستخدم قدرة Gemini 2.0 على التفكير عبر النصوص والصور والعناصر التفاعلية مثل النماذج داخل المتصفح. وفي الاختبارات الأولية، حقق معدل نجاح بنسبة 83.5% على معيار WebVoyager لاستكمال مهام الويب الشاملة. يساعد المختبرون الأوائل الذين يستخدمون امتداد Chrome على تحسين قدرات Mariner بينما تقوم Google بتقييم تدابير السلامة التي تضمن بقاء التكنولوجيا سهلة الاستخدام وآمنة.
- جولز: وكيل ترميز للمطورين
Jules، وهو مساعد مدعوم بالذكاء الاصطناعي مصمم للمطورين، يتكامل مباشرة مع سير عمل GitHub لمواجهة تحديات البرمجة. ويمكنه اقتراح الحلول بشكل مستقل وإنشاء الخطط وتنفيذ المهام المستندة إلى التعليمات البرمجية — كل ذلك تحت الإشراف البشري. يعد هذا المسعى التجريبي جزءًا من هدف Google طويل المدى لإنشاء عوامل ذكاء اصطناعي متعددة الاستخدامات عبر مجالات مختلفة.
- تطبيقات الألعاب وما بعدها
من خلال توسيع نطاق وصول Gemini 2.0 إلى البيئات الافتراضية، يعمل Google DeepMind مع شركاء الألعاب مثل Supercell على وكلاء الألعاب الأذكياء. يمكن لرفاق الذكاء الاصطناعي التجريبي هؤلاء تفسير إجراءات اللعبة في الوقت الفعلي، واقتراح الاستراتيجيات، وحتى الوصول إلى المعرفة الأوسع عبر البحث. يتم إجراء الأبحاث أيضًا حول كيفية دعم المنطق المكاني لـ Gemini 2.0 للروبوتات، وفتح الأبواب لتطبيقات العالم المادي في المستقبل.
معالجة المسؤولية في تطوير الذكاء الاصطناعي
ومع توسع قدرات الذكاء الاصطناعي، تؤكد جوجل على أهمية إعطاء الأولوية للاعتبارات المتعلقة بالسلامة والأخلاق.
تدعي Google أن Gemini 2.0 خضع لتقييمات واسعة النطاق للمخاطر، مدعومة بإشراف لجنة المسؤولية والسلامة للتخفيف من المخاطر المحتملة. بالإضافة إلى ذلك، تسمح قدراتها المنطقية المضمنة بـ “التعاون الأحمر” المتقدم، مما يمكّن المطورين من تقييم سيناريوهات الأمان وتحسين تدابير السلامة على نطاق واسع.
تستكشف Google أيضًا إجراءات وقائية لمعالجة خصوصية المستخدم، ومنع إساءة الاستخدام، وضمان بقاء عملاء الذكاء الاصطناعي موثوقين. على سبيل المثال، تم تصميم Project Mariner لتحديد أولويات تعليمات المستخدم مع مقاومة الحقن السريعة الضارة، ومنع التهديدات مثل التصيد الاحتيالي أو المعاملات الاحتيالية. وفي الوقت نفسه، تسهل عناصر التحكم في الخصوصية في Project Astra على المستخدمين إدارة بيانات الجلسة وتفضيلات الحذف.
وأكد بيتشاي مجددًا التزام الشركة بالتنمية المسؤولة، قائلًا: “نحن نؤمن إيمانًا راسخًا بأن الطريقة الوحيدة لبناء الذكاء الاصطناعي هي أن تكون مسؤولاً منذ البداية”.
مع إصدار Gemini 2.0 Flash، تقترب Google من رؤيتها المتمثلة في بناء مساعد عالمي قادر على تحويل التفاعلات عبر المجالات.
أنظر أيضا: تجاهل التعلم الآلي: الباحثون يجعلون نماذج الذكاء الاصطناعي “تنسى” البيانات
هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الضخمة من قادة الصناعة؟ اطلع على معرض الذكاء الاصطناعي والبيانات الضخمة الذي يقام في أمستردام وكاليفورنيا ولندن. ويقام هذا الحدث الشامل في موقع مشترك مع أحداث رائدة أخرى بما في ذلك مؤتمر الأتمتة الذكية، وBlockX، وأسبوع التحول الرقمي، ومعرض الأمن السيبراني والسحابي.
استكشف الأحداث والندوات عبر الإنترنت القادمة الأخرى المتعلقة بتكنولوجيا المؤسسات والمدعومة من TechForge هنا.