كشفت Google النقاب عن سلسلة من التحديثات لعروض الذكاء الاصطناعي الخاصة بها، بما في ذلك تقديم Gemini 1.5 Flash، وتحسينات على Gemini 1.5 Pro، والتقدم في Project Astra، رؤيتها لمستقبل مساعدي الذكاء الاصطناعي.
يعد Gemini 1.5 Flash إضافة جديدة إلى عائلة نماذج Google، وهو مصمم ليكون أسرع وأكثر كفاءة للعمل على نطاق واسع. على الرغم من كونه أخف وزنًا من 1.5 Pro، فإنه يحتفظ بالقدرة على التفكير متعدد الوسائط عبر كميات هائلة من المعلومات ويتميز بنافذة سياق طويلة مذهلة مكونة من مليون رمز مميز.
“1.5 فلاش يتفوق في التلخيص، وتطبيقات الدردشة، والتعليق على الصور والفيديو، واستخراج البيانات من المستندات والجداول الطويلة، وأكثر من ذلك،” أوضح ديميس هاسابيس، الرئيس التنفيذي لشركة Google DeepMind. “وهذا لأنه تم تدريبه بواسطة 1.5 Pro من خلال عملية تسمى “التقطير”، حيث يتم نقل المعرفة والمهارات الأساسية من نموذج أكبر إلى نموذج أصغر وأكثر كفاءة.”
وفي الوقت نفسه، قامت Google بتحسين قدرات نموذج Gemini 1.5 Pro بشكل كبير، مما أدى إلى توسيع نافذة السياق الخاصة به إلى مليوني رمز مميز. تم إجراء تحسينات على إنشاء التعليمات البرمجية والتفكير المنطقي والمحادثة متعددة المنعطفات وقدرات فهم الصوت والصورة.
قامت الشركة أيضًا بدمج Gemini 1.5 Pro في منتجات Google، بما في ذلك تطبيقات Gemini Advanced وWorkspace. بالإضافة إلى ذلك، أصبح Gemini Nano يفهم الآن المدخلات متعددة الوسائط، ويتوسع إلى ما هو أبعد من النص فقط ليشمل الصور.
أعلنت Google عن الجيل التالي من النماذج المفتوحة، Gemma 2، المصممة لتحقيق أداء وكفاءة مذهلين. تتوسع عائلة Gemma أيضًا مع PaliGemma، أول نموذج لغة رؤية للشركة مستوحى من PaLI-3.
أخيرًا، شاركت Google التقدم المحرز في مشروع Astra (الوكيل المستجيب للرؤية والتحدث المتقدم)، ورؤيتها لمستقبل مساعدي الذكاء الاصطناعي. قامت الشركة بتطوير وكلاء نماذج أولية يمكنهم معالجة المعلومات بشكل أسرع وفهم السياق بشكل أفضل والاستجابة بسرعة في المحادثة.
“لقد أردنا دائمًا بناء عامل عالمي يكون مفيدًا في الحياة اليومية. يوضح ساندر بيتشاي، الرئيس التنفيذي لشركة Google، أن مشروع Astra يُظهر فهمًا متعدد الوسائط وقدرات محادثة في الوقت الفعلي.
“مع مثل هذه التكنولوجيا، من السهل تصور مستقبل حيث يمكن للناس أن يكون لديهم مساعد خبير في الذكاء الاصطناعي إلى جانبهم، من خلال الهاتف أو النظارات.”
وتقول جوجل إن بعض هذه الإمكانيات ستأتي إلى منتجاتها في وقت لاحق من هذا العام. يمكن للمطورين العثور على جميع الإعلانات المتعلقة بـ Gemini التي يحتاجونها هنا.
أنظر أيضا: يوفر GPT-4o تفاعلًا مشابهًا للذكاء الاصطناعي مع تكامل النص والصوت والرؤية
هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الضخمة من قادة الصناعة؟ اطلع على معرض الذكاء الاصطناعي والبيانات الضخمة الذي يقام في أمستردام وكاليفورنيا ولندن. ويقام هذا الحدث الشامل في موقع مشترك مع أحداث رائدة أخرى بما في ذلك مؤتمر الأتمتة الذكية، وBlockX، وأسبوع التحول الرقمي، ومعرض الأمن السيبراني والسحابي.
استكشف الأحداث والندوات عبر الإنترنت القادمة الأخرى المتعلقة بتكنولوجيا المؤسسات والمدعومة من TechForge هنا.