عقدت جوجل مؤتمرها السنوي للمطورين Google I/O 2024 اعتبارًا من أمس، الثلاثاء، وفي الكلمة الرئيسية التي تكشف خلالها الشركة عن جديد تقنياتها، كان الحديث يتمحور بشكل شبه كامل عن آخر ما توصلت له الشركة من قدرات الذكاء الاصطناعي التوليدي والميزات التي ستصل للمستخدمين قريبًا.
يقدم تكنولوجيا نيوز في هذا التقرير، ملخصًا للمؤتمر ورصد أبرز ما تم الإعلان عنه.
البحث عن طريق الفيديو في Lens
كشف جوجل عن تحديث قادم لميزة “دائرة البحث – Circle to Search” في نظام أندرويد، وأصبح بإمكانها اجراء البحث من خلال الفيديو عبر ميزة Lens المدمجة في تطبيق جوجل.
هذه إضافة بجانب الصور التي كانت المصدر الأساسي لمصدر البحث في Lens.
البحث في محتوى الصور
تم الإعلان عن تكامل أداة الذكاء الاصطناعي الخاصة بجوجل، جيميني، مع العديد من التطبيقات، من بينها تطبيق الصور، لتقديم إمكانية البحث عن الصور وفقًا لمحتواها، واستخراج أي معلومات منها بسهولة وسرعة.
خيار جيميني جديد
تقدم جوجل عدة خيارات من نموذج الذكاء الاصطناعي الأحدث جيميني 1.5، وهذا العام أضافت جيميني 1.5 فلاش، وهو أخف من الخيار المتقدم Gemini Advanced المدفوع، وأكثر سرعة ودقة من الخيار الأخف Gemini Nano، كما أنه لا يتطلب اشتراكًا مدفوعًا ويعمل على الجهاز نفسه مثل Gemini Pro.
الخيار ستعتمد عليه الشركة في دمج الذكاء الاصطناعي في عدد من تطبيقات وخدمات جوجل المختلفة، أبرزها متصفح كروم.
توسع الذكاء الاصطناعي في ورك سبيس
بعد نجاح دمج جيميني مع جيميل، أعلنت جوجل عن اعتزامها توسيع أداة الذكاء الاصطناعي للعمل مع خدمات أخرى في ورك سبيس مثل تطبيق المستندات “Docs”، جداول البيانات “Sheet”، العروض التقديمية “Slides”، وخدمة التخزين درايف.
بالإضافة لذلك، سيكون هناك تحسين على جيميني داخل جيميل، بحيث يمكنه تقديم مقترحات أفضل للرد على رسائل البريد الإلكتروني.
مشروع المستقبل.. أسترا
أعطت جوجل لمحة عن تصورها لمستقبل الاعتماد على تقنيات الذكاء الاصطناعي المتقدمة عبر الكشف عن مشروع أسترا، وهو مشروع متعدد الوسائط تأمل من خلاله تطوير مساعد رقمي أكثر ذكاءً وقادر على القيام بالعديد من الخدمات في الحياة اليومية بسرعة ودقة.
أداة فيو Veo لإنشاء مقاطع فيديو عالية الدقة
تم الكشف عن أداة فيو، وهو نموذج ذكاء اصطناعي توليدي جديد يمكنه إنشاء فيديو بدقة 1080 بكسل بناءً على المطالبات النصية والصورة والفيديو.
يمكن لفيو إنتاج مقاطع الفيديو بمجموعة متنوعة من الأساليب، مثل اللقطات الجوية أو اللقطات المتتابعة، ويمكن تعديلها بمزيد من المطالبات، وسيتم تقديمه بشكل منفرد بجانب دمجه مع يوتيوب شورتس لإنشاء فيديوهات قصيرة على منصة الفيديوهات الأشهر.
Whether you need a yoga bestie or calculus tutor, in the coming months you’ll be able to customize Gemini, saving time when you have specific ways you interact with Gemini again and again. We’re calling these Gems. #GoogleIO pic.twitter.com/YQOHsUbMWE
— Google (@Google) May 14, 2024
ميزة Gems لإنشاء بوت دردشة مخصص للمطورين
أعلنت جوجل عن توفير ميزة Gems داخل جيميني، وهي ميزة تسمح للمطورين بإنشاء بوت دردشة مخصصًا لخدمات يتم تحديدها مسبقًا، وسيكون بمقدور المطورين عرضها في متجر خاص داخل جيميني بشكل مجاني أو مدفوع.
تتيح Gems للمستخدمين إعطاء تعليمات إلى جيميني لتخصيص كيفية استجابتها وما تتخصص فيه، مثل؛ أن يكون بوت دردشة كمدربًا خاصًا لأي من الرياضات، أو طاهي مساعد في إعداد وجبات.
تحسين الدردشة الصوتية في جيميني
أعلنت الشركة عن إضافة ميزة جيميني لايف Gemini Live تهدف إلى جعل المحادثات الصوتية مع بوت الدردشة تبدو طبيعية أكثر.
سيتم تحديث الصوتيات للبرنامج ببعض السمات الإضافية، وسيتمكن المستخدمون من مقاطعته في منتصف الجملة أو مطالبته بالمشاهدة من خلال كاميرا هواتفهم الذكية وتقديم معلومات حول ما يراه في الوقت الفعلي.
تكامل جيميني مع برامج جوجل الشائعة
أعلنت جوجل عن دمج لأداة الذكاء الاصطناعي جيميني مع بعض تطبيقاتها الأكثر شيوعًا، مما يتيح تحديث المعلومات أو استخلاصها من تطبيقات، التقويم Calendar، المهام Tasks وتطبيق الملاحظات Keep، وذلك باستخدام ميزات متعددة الوسائط للقيام بذلك، مثل؛ إضافة تفاصيل من نشرة إعلانية إلى التقويم، استخراج عناصر وجبة طعام من فيديو وإضافتها إلى تطبيق الملاحظات.
دائرة البحث لحل الواجبات الدراسية
وصلت تحديثات لميزة دائرة البحث – Circle to Search الجديدة التي تعمل بالذكاء الاصطناعي على أجهزة أندرويد، وأصبحت الآن قادرة على حل المسائل الرياضية اللفظية والفيزياء لمساعدة الطلاب في الواجبات الدراسية.
لن تقوم الميزة بتقدم الحل مرة واحدة للمسائل، ولكنها تأتي لتكون مثل مساعد للطلاب على حل المسائل الصعبة عليهم من مختلف المراحل الدراسية.
قالت جوجل أنه سيتم تحديث الميزة مرة أخرى في هذا الاتجاه، لتكون قادرة على حل معادلات رياضية معقدة تحتوي على الرموز والرسوم البيانية.
تحسين محرك البحث
أكدت جوجل بدء التوسع والاعتماد الكامل لتحسين محرك البحث الخاص بها بدعم قدرات الذكاء الاصطناعي، بعد عام من اختبارها لدى عدد محدد من المستخدمين في الولايات المتحدة.
سيصل محرك البحث الجديد المدعوم بالذكاء الاصطناعي المتقدم، تدريجيًا إلى جميع المستخدمين في الولايات المتحدة اعتبارًا من يوم الثلاثاء، على أن تصل قريبًا لمليارات المستخدمين حول العالم.
الآن، سيقوم نموذج الذكاء الاصطناعي الخاص بالشركة والمخصص لمحرك البحث، بتصميم صفحات النتائج وملؤها بإجابات مختصرة من الويب.
حماية مستخدمي هواتف أندرويد من مكالمات الاحتيال
كانت واحدة من أبرز التقنيات التي كشفت جوجل أنها ستصل إلى نظام أندرويد، هي إمكانية التعرف على سير المكالمات الهاتفية التي تصل للمستخدم، وتنبيهه في حالة محاولة الطرف الآخر من المكالمة القيام بأي من خدع الاحتيال.
المثال الذي قدمته الشركة، أن أداة الذكاء الاصطناعي المدمجة في أندرويد ستتعرف على سير المكالمات، وفي حالة اكتشاف أي من طرق أو طلبات من الطرف الآخر لبيانات خاصة – مثل بيانات البطاقة المصرفية – ستصدر تنبيهًا فوريًا لتحذير المستخدم أثناء المكالمة.
جيميني أكثر ذكاءً على أندرويد
قالت جوجل أنها على وشك تحديث تطبيق الذكاء الاصطناعي جيميني على نظام أندرويد، مما يجعله يتعرف على العديد من الأنواع على شاشة الهاتف يعرضها المستخدم، واستخدامه بتكامل مع تطبيقات أخرى قيد التشغيل دون الحاجة للتبديل بين التطبيقات.
إصدار جيميني الحالي على أندرويد يظهر على الشاشة لبدء محادثة مع بوت الذكاء الاصطناعي، والاستعانة بالصور الثابتة ولقطات الشاشة لإجراء البحث واستخراج بيانات عنها، لكنه قريبًا سيكون قادرًا على التعرف على مقاطع الفيديو كذلك.
بمجرد استدعاء جيميني سيكون التطبيق قادرًا على تقديم استفسارات عن مقطع فيديو يقوم المستخدم بمشاهدته في نفس اللحظة والإجابة على أسئلة متعلقة بما يحتويه، واستخراج بيانات ومعلومات يطلبها المستخدم.
كذلك سيكون التطبيق قادرًا على فهم محتوى ملف PDF معروض على الشاشة وتقديم نفس الخدمات للمشتركين في الإصدار المدفوع لخدمة الذكاء الاصطناعي، Gemini Advanced.
الذكاء الاصطناعي قادم لمتصفح كروم
أكدت جوجل أنها ستضيف نموذج الذكاء الاصطناعي Gemini Nano الخفيف في الإصدار القادم من متصفح جوجل كروم لأجهزة الكمبيوتر (Chrome 126).
سيستخدم المساعد المدمج الذكاء الاصطناعي الموجود على الجهاز لمساعدة المستخدم في كتابة نصوص، سواء في بحثٍ أو منشورات وسائل التواصل الاجتماعي أو في الأعمال مثل كتابة وصف لمنتج معين والمراجعات والمزيد، من داخل المتصفح مباشرة.
علامة خفية لتمييز محتوى الذكاء الاصطناعي
كشفت جوجل عن أداة SynthID وهي عبارة عن وسيلة لإضافة علامة مائية على المحتوى الذي يتم انشائه من أي خدماتها للذكاء الاصطناعي التوليدي المتقدم.
العلامات ستضاف لمقاطع الفيديو من Veu وصور Imagen وصوتيات Lyria ونصوص Gemini التي ينتجها الذكاء الاصطناعي المتقدم، بحيث لا تظهر للمستخدم العادي ولكن يمكن استكشافها عبر برامج خاصة ستقدمها للشركات التي تريد اكتشاف مواد التكنولوجيا المتقدمة.
تعد هذه ضمانات من جوجل لحماية المستخدمين من إساءة استخدام الذكاء الاصطناعي وسرعة انتشاره الكبيرة، وتعد بأنها ستقدم SynthID للشركات الأخرى – خاصة وسائل التواصل الاجتماعي – لتمييز أي محتوى تم نشره عليها من خلال أي من أدواتها المتقدمة للذكاء الاصطناعي، للاستفادة منها بعد ذلك في تنبيه المستخدم العادي ومساعدته على فهم ما يشاهده.