كانت الكلمة الرئيسية لـ I/O 2024 من Google مليئة بـ طن من ميزات الذكاء الاصطناعي الجديدة القادمة إلى سطح المكتب والهاتف المحمول، بفضل Gemini. وستكون هناك طرق جديدة للبحث في Google من خلال طلبات الفيديو والطلبات السريعة متعددة الوسائط، بينما تحصل الهواتف الذكية في نهاية المطاف على قوى الذكاء الاصطناعي الخارقة من خلال الكاميرا باستخدام Project Astra.
ولكن هناك ميزة واحدة لفتت انتباهي حقًا: اسأل الصور مع Gemini في صور Google.
أولاً ما هو برج الجوزاء؟
بداية، ما هو برج الجوزاء؟ إنها في الأساس عائلة Google من نماذج الذكاء الاصطناعي، والتي تشمل Gemini Nano وGemini Pro وGemini Ultra. باختصار، إنها نسخة Google من OpenAI ونماذج GPT الخاصة بها، مثل ChatGPT.
يمكن لـ Gemini فهم وإنشاء النص مثل نماذج اللغات الكبيرة الأخرى (LLMs)، مثل OpenAI's GPT. ومع ذلك، يمكن لـ Gemini أن يفعل أكثر من ذلك بقليل، فهو يفهم أشكالًا أخرى من المعلومات ويعمل عليها ويجمعها مثل الصور والفيديو والصوت وحتى التعليمات البرمجية.
بالنسبة للهواتف الذكية التي تعمل بنظام Android، فهو يستخدم Gemini Nano، الذي يعمل محليًا على الجهاز نفسه. بفضل نموذج Gemini Nano، ستتحسن الميزات الحالية مثل Circle to Search مع القدرة على مساعدة الطلاب في واجباتهم المدرسية في الفيزياء والرياضيات.
سيكون أيضًا أكثر وعيًا بالسياق لما هو موجود حاليًا على شاشتك، حيث ستتمكن من طرح أسئلة على Gemini حول مقطع فيديو تشاهده أو ملف PDF طويل تتصفحه بدلاً من تمرير عشرات الصفحات. كما سيوفر Gemini Nano إمكانات متعددة الوسائط لهاتفك الذكي، مثل استعلامات البحث ذات الطلبات المتعددة في طلب واحد.
تعد ميزة Ask Photos with Gemini واحدة من العديد من ميزات Gemini الجديدة التي تم الإعلان عنها في I/O 2024، وستكون متاحة في Google Photos في وقت لاحق من هذا العام. باختصار، يمكنك البحث في مكتبة الصور الضخمة الخاصة بك باستخدام أسلوب محادثة أكثر بدلاً من الكلمات الرئيسية.
في العرض التوضيحي لمؤتمر Google I/O، أظهرت Google أنه يمكنك فقط طرح السؤال التالي: “ما هي لوحة الترخيص الخاصة بي مرة أخرى؟” أو “متى تعلمت ابنتي السباحة؟” لإحضار الصور التي تجيب على تلك الطلبات.
بل إنها تذهب أبعد من ذلك من خلال طلبات مثل “أرني كيف تقدمت ابنتي في السباحة”. مثل هذه الاستعلامات تجعل الجوزاء يراجع صورك حسب التاريخ والسياق للحصول على النتيجة المناسبة.
عندما تم عرض برنامج Ask Photos with Gemini على المسرح، كنت متحمسًا، ولا أستطيع الانتظار حتى أضع يدي عليه.
رفيق الذكاء الاصطناعي للوالدين
لقد كنت أمًا منذ ما يزيد قليلاً عن عامين. لكن في ذلك الوقت، التقطت صورًا أكثر من أي وقت مضى لأنني أحب التقاط كل اللحظات الصغيرة لابنتي، سواء كانت مجرد كونها لطيفة وسخيفة أو تلك المعالم الهامة التي أريد التقاطها في صورة أو فيديو. مع هاتف iPhone 15 Pro بسعة 1 تيرابايت، وعدد لا يحصى من هواتف Android التي اختبرتها، فأنا كذلك دائماً التقاط صور لابنتي.
ربما تظن أن هذا مبالغة، وربما يكون كذلك. لكن ليس لدي الكثير من الصور، ناهيك عن مقاطع الفيديو، عن طفولتي من والدي. لم يلتقطوا حقًا كل لحظاتي الخاصة، وليس لدي سوى ذكريات غامضة، لا شيء مفصل أو محدد للغاية. مع كل التكنولوجيا المتوفرة لدينا الآن، فقد ساعدتني على التأكد من أن ابنتي سيكون لديها دليل مرئي على طفولتها.
على الرغم من أنني ألتقط صورًا ومقاطع فيديو لمشاركتها مع أفراد العائلة واختيار الأصدقاء، إلا أنني غالبًا ما ألتقط هذه اللحظات لأنني أريد الرجوع إليها لاحقًا. سواء كنت أبحث فقط عن انتعاش سريع لأرسم البسمة على وجهي أو عندما أكون سيدة عجوز خرفية وأحتاج إلى السير في حارة الذاكرة، فإنني أتصفح ذكرياتي البصرية قليلاً.
مع تطبيق Ask Photos with Gemini، لا أستطيع الانتظار حتى أطلب منه إظهار التقدم الذي أحرزته ابنتي في مختلف أحداث الحياة. على سبيل المثال، سنبدأها في مرحلة ما قبل المدرسة في شهر أغسطس. أود أن أطلب من الجوزاء أن تريني التقدم الذي أحرزته طوال المدرسة أو أن تريني فقط كل “أيامها الأولى” في كل عام دراسي. أو عندما تتعلم ركوب الدراجة، أستطيع أن أرى تقدمها وهي تنتقل من عجلات التدريب إلى ركوب الدراجة بالكامل. تبا، يمكن أن يريني الجوزاء عندما تطفئ ابنتي شموع كعكة عيد ميلادها كل عام.
هناك الكثير من الإمكانيات بالنسبة لي لاستخدام Ask Photos، ولكن هذه مجرد بعض الأفكار التي تتبادر إلى ذهني. وعلى الرغم من أنه رائع للآباء من أجل إنجازات أطفالهم، فهو رائع أيضًا لأشياء أخرى أيضًا. أستطيع أن أرى نفسي أستخدمه في المناسبات السنوية والعطلات وحتى حيواناتي الأليفة.
بالتأكيد، يمكنني الآن تصفح جميع صوري والبحث باستخدام الوجوه والكلمات الرئيسية. ولكن يبدو أن Ask Photos with Gemini هو طريقة أبسط وأسرع وأكثر طبيعية للقيام بذلك. وعندما يكون لديك مكتبة صور تحتوي على أكثر من 50000 صورة ومقطع فيديو، حسنًا، يمكنني استخدام طريقة أسهل للبحث فيها.
لا استطيع الانتظار لاستخدام هذا
Ask Photos ليست ميزة Gemini AI الوحيدة التي عرضتها Google في Google I/O 2024. وعلى الرغم من أنها الميزة الوحيدة التي أعرضها معظم متحمس بشأنه نظرًا لطابعه العملي، وهناك أشياء أخرى مثيرة أريد التحقق منها أيضًا.
على سبيل المثال، بدا مشروع أسترا مثيرًا للاهتمام. غالبًا ما أستخدم هاتفي لالتقاط صورة لشيء أريد حفظه لوقت لاحق ومعرفة المزيد عنه، مثل النباتات والزهور. ولكن مع Astra، سيكون لديك جودة الذكاء الاصطناعي في الكاميرا، ويمكن أن تخبرك بما تنظر إليه في الوقت الفعلي. وعلى الرغم من أن جوجل لم تعلن عن أي نظارات ذكية، إلا أن مشروع Astra أظهر أن هذه ستكون ميزة مذهلة في النظارات الذكية في مرحلة ما.
أنا أيضًا متشوق جدًا للتحقق من طلبات المطالبة متعددة الوسائط في بحث Google المدعوم من Gemini. أنا لست من النوع الذي يستمتع بالتخطيط لأي شيء، لذا إذا تمكنت Google من القيام بالعمل نيابةً عني، فأنا أؤيد ذلك تمامًا. وعلى الرغم من أنني لا أعتقد أن تنبيهات الاحتيال في الوقت الفعلي ستكون مفيدة جدًا بالنسبة لي (لا أرد على الهاتف أبدًا على أي حال)، إلا أنها ستكون ميزة مفيدة جدًا للآخرين.
من المفترض أن تشق ميزة Ask Photos with Gemini طريقها إلى Google Photos في وقت لاحق من هذا الصيف، ولا أستطيع الانتظار لتجربتها.