من المثير للقلق إلى حد ما أن نسمع منظمة العفو الدولية يتحدث بنبرة ودية بشكل مخيف وتطلب مني تنظيف الفوضى على محطة العمل الخاصة بي. أنا فخور به إلى حد ما ، لكنني أعتقد أن الوقت قد حان لتكديس الأدوات المنتشرة بشكل عشوائي وترتيب الفوضى السلكية.
أختي توافق أيضًا. لكن القفز إلى العمل بعد “يرى” منظمة العفو الدولية طاولتي ، ويتعرف على الفوضى ، ويتعرف على نصيحة رابطة المنزل هي الصورة الأكبر. يمكن الآن الآن القيام بذلك. وأكثر من ذلك بكثير.
الصلصة السرية هنا هي تحديث حديث للميزات يسمى Project Astra. لقد كان قيد التطوير لسنوات ، وبدأت أخيرًا في الخروج في وقت سابق من هذا الشهر. الفكرة الشاملة هي خدمة الذكاء الاصطناعى الشاملة ، والذكي ، والذكي على هاتفك.
Google Hawks هذه القوى العظمى تحت اسم غير ملهم إلى حد ما: Gemini يعيش مع الكاميرا ومشاركة الشاشة. تم تطوير الشركة في وحدة DeepMind الخاصة بالشركة ، وبدأت تطويرها كـ “مساعد عالمي لمنظمة العفو الدولية”. إنه لأمر مخز أن الاسم النهائي ليس طموحًا.
لنبدأ بوضع الوصول. القدرة متاحة الآن لمستخدمي Pixel 9 و Galaxy S25. ولكن إذا كان لديك هاتف Android مع اشتراك متقدم Gemini للذهاب إليه ، فيمكنك الوصول إلى مجموعة الأدوات الجديدة.
سيكون ذلك 20 دولارًا شهريًا ، بالمناسبة. لقد جربته على الهاتفين المذكورين ، وأصبح الآن جاهزًا للتشغيل على OnePlus 13 أيضًا. أجمل جزء؟ ليس عليك أن تمر بأي أطواق تقنية للوصول إليها.
التحرير والسرد الزر/وحدة التخزين ، أو تمرير زاوية الشاشة لاستدعاء الجوزاء هو كل ما تحتاجه. لا يهم التطبيق الذي تقوم بتشغيله ، يمكنك الوصول إلى القطع الجديدة في تقاسم الشاشة كتراكب في كل ركن من أركان نظام التشغيل.
فهم العالم من حولك
بدأت بتوجيه الكاميرا إلى لوحة ، وسألت عنها. تمكنت Gemini Live من اكتشافها بدقة كوحة على طراز Madhubani ، حيث فك تشفير الاستخدام الجريء للألوان وتصوير الحيوانات.

ثم شرع في إعطائي درسًا موجزًا للتاريخ والتغيرات التي تطورت على مر السنين. كانت المعلومات دقيقة ، وصولاً إلى مستوى الحبيبات. لحسن الحظ ، يمكنك أيضًا اختيار الحصول على مستندات إلى الوراء مع Gemini ، إذا كنت في مكان يمكن أن تكون فيه المحادثات الصوتية محرجة.
أكثر ما يعجبني حول الكاميرا الجديدة من Gemini Live وشاشة Avatar هو أنها ليست شائعة للغاية. يمكنك مقاطعة ذلك في أي لحظة معينة ، والتي تضيف فقط إلى جاذبية “الطبيعية” للمحادثات.
حاولت الجوزاء في مجموعة متنوعة من السيناريوهات. لم أكن مستعدًا لذلك.
عادةً ما تكون الإجابات التي توفرها موجزة ، كما لو كانت تريد أن تمنحك فرصة (أو حتى تدفع) لطرح سؤال متابعة بدلاً من إعطاء إجابة طويلة للغاية. يتفوق في مجموعة كاملة من الموضوعات والسيناريوهات البصرية ، ولكن هناك بعض المزالق.

لا يمكن استخدام عدسة Google حتى الآن ، مما يعني أنه لا يمكن لـ Gemini مقارنة الصور التي تراها على شاشة هاتفك مقابل نتائج مطابقة على الويب. علاوة على ذلك ، لا يمكن الوصول إلى المعلومات في الوقت الفعلي إذا طلبت من Gemini البحث عن أحدث التطورات حول موضوع أو شخصية.
سألت ذلك عن الأنواع النباتية ، وقوائم المطاعم ، والتقاط البيانات من لوحات الملاحظات ، وفهم الوصفات الطبية الخاصة بي لمباراة من الأنفلونزا. حقق Gemini أداءً جيدًا ، أكثر من أي وقت مضى من أي وقت مضى من خلال أداء AI chatbot حتى الآن.
فتح بنك المعرفة
بعد ذلك ، دفعت الجوزاء لفهم المواد الأكاديمية المعقدة. أضع كتابًا عن التعلم الآلي في إطار الكاميرا. لم يعترف Gemini Live بذلك فحسب ، بل شرع أيضًا في إعطائي نظرة عامة على محتويات الكتاب ومواضيعه الأساسية.

من الغريب ، بدأت في التقليب عبر الصفحات وهبطت في قائمة الفصل. أدركت الذكاء الاصطناعى التقدم ، وتوقف عن الحديث ، وسألني عما إذا كنت مهتمًا بأي فصل معين الآن أنني كنت أتحقق من قائمة الموضوعات.
لقد فوجئت بالدهشة في هذه اللحظة.
لقد طلبت من ذلك تحطيم بعض الموضوعات المعقدة ، وقامت الذكاء الاصطناعى بعمل محترم ، حتى تجاوز نطاق المواد على الصفحة وسحب المعلومات من بنك المعرفة الواسع.
على سبيل المثال ، عندما سألت ذلك عن محتويات الصفحة التمهيدية على رواية Bhisham Sahni ، التقطت منظمة العفو الدولية جائزة Sahitya Akademi بشكل صحيح. ثم استمر في ذكر التفاصيل التي لم يتم إدراجها على الصفحة ، مثل السنة التي فاز فيها بالشرف الأدبي المرموق وما يدور حوله الكتاب.
على الجانب الآخر ، كانت قراءة اللغة الهندية من Gemini Live مروعة. لم تكن مجرد لهجة سيئة ، ولكن حقيقة أن الجوزاء كان ينطق بربط نقي وبلا الكلمات مرارا وتكرارا. أثناء محاولة قراءة الأردية والفارسية والعربية ، قامت بعمل أفضل إلى حد كبير ، ولكن غالبًا ما تمزج الكلمات من خطوط عشوائية.

في محاولتي الأولى مع الشعر الأردية ، لم يعترف ليس فقط النص الأردية ، ولكن أيضًا أعطى ملخصًا دقيقًا للقصيدة. التحدي الأكبر ، مرة أخرى ، كان السرد. سماع نسخة Anglicized من الأردية تؤذي أذني حقًا.
يتفوق في المواقع المدهشة
AI هي أداة رائعة لحل المشكلات ، وهناك العديد من المعايير لإثبات ذلك. لقد اختبرته ضد مشاكل الفيزياء في التعامل مع الديناميكا الحرارية والمعادلات الكهروكيميائية والمشاكل الإحصائية التي تظهر في دفتر ملاحظات مكتوب بخط اليد. قام Gemini Live بعمل رائع في مثل هذه المهام.
حتى أنها تفوقت في الأعمال الإبداعية ، أيضا. قدمت أختي ، وهي مصممة أزياء ، أحد رسوماتها في عرض الكاميرا ، وطلبت التعليقات وكذلك التحسينات. بدأت Gemini Live مع الإشادة بالتصميم ، ووجه أوجه التشابه مع أيديولوجية تصميم علامات أزياء قليلة ، وقدمت عدد قليل من التوصيات.

عندما تم حثها على ذلك ، نصحت الذكاء الاصطناعى أختي أيضًا بأفضل الأدوات لتحويل الرسومات المرسومة باليد إلى مفاهيم رقمية. لقد اتبعت كلمات التوجيه هذه من خلال توفير معلومات مفيدة عن مكدس البرامج وحيث يمكن للمرء أن يجد مواد تعليمية.
عندما أضع بضع بطاريات دوراسيل في عرض الكاميرا ، لم يتم التعرف عليها بدقة فحسب ، بل أخبرتني أيضًا أن منصات التجارة الإلكترونية المفرطة التي يمكنها توصيلها إلي في غضون دقائق.
الخدمات – المسمى Blinkit و Swiggy Instamart – متوفرة فقط في الهند ومعظمها مخصصة للمواطف الحضرية. حتى في غرفة مضاءة بشكل خافت ، كان قادرًا على تحديد زوج من سماعات الأذن السلكية في المحاولة الأولى.
الوعي بالوضع هو بدعته القوية.
بالمقارنة مع دردشة الجوزاء المعتادة أو ما تجده في قسم نظرة عامة على AI في Google Search ، فإن محادثات Gemini Live تتخذ مقاربة أكثر حذراً للتخلص من المعرفة ، خاصةً إذا كانت حساسة في الطبيعة. لقد لاحظت أن الموضوعات مثل توصيات الطعام والعلاج الطبي يتم التعامل معها بنهج حذر بشكل متزايد ، وغالبًا ما يتم دفع المستخدمين للعثور على مورد الخبراء المناسب.
بعض المزالق المألوفة

إن الوجبات السريعة الساحقة هي أن تحول الجوزاء “مشروع Astra” أمر مثير للإعجاب. إنها لمحة عن مستقبل ما يمكن أن تحققه الهواتف الذكية. مع بعض التحسينات والتكامل وسير العمل عبر التطبيقات ، يمكن أن تجعل بحث Google يشعر وكأنه بقايا قديمة. ولكن في الوقت الحالي ، هناك بعض العيوب الصارخة.
في مناسبات قليلة ، لاحظت أن نظام الذاكرة يسير. عندما طلب من الذكاء الاصطناعى تحديد نطاق اللياقة في عرض الكاميرا ، فقد أدركها بشكل صحيح على أنها Samsung Galaxy Fit 3. ولكن عندما دفعت سؤالًا متابعًا ، فقد اعتبرت عن طريق الخطأ أن يكون الجهاز شريط لياقة من Huawei.
يمكن أن تكذب بشكل صارخ. وبشكل واثق تمامًا ، قد أقول. على سبيل المثال ، عندما أخبرتها بتلخيص تقييمي للجهاز القابل للارتداء ، أجاب الذكاء الاصطناعى أن الاتجاهات الرقمية لم تستعرضها بعد. في الواقع ، تم نشر المقال قبل أسبوع.
بعد ذلك ، طلبت ذلك أن تمر ببعض المقالات على صفحة المؤلف الخاصة بي بعد تمكين مشاركة الشاشة. قام الجوزاء بعمل لائق في شرح القصص ، لكنه تعثر أحيانًا في فهم السياق. على سبيل المثال ، ذكر بشكل غير صحيح أن Intel و AMD فقط يمكن أن يصنعوا NPU التي تتأهل لشارة Copilot+.

من ناحية أخرى ، يذكر المقال بوضوح أن كوالكوم كان أول من يفي بالمعايير ، قبل المنافسة. وأنه لم يتمكن AMD و Intel في أواخر العام الماضي فقط من رفع مستوى AMD و Intel وتلبية خط الأساس لرقاقة الذكاء الاصطناعى مع مجموعة جديدة من المعالجات.
في منتصف المحادثة حول مقال ، واجهت مرة أخرى مشكلة الذاكرة. بدلاً من تلخيص القصة التي تمت مناقشتها ، عادت إلى الحديث عن المقال الأول الذي شاهدته عبر مشاركة الشاشة. عندما قاطعتها في منتصف الطريق من خلال السرد ، حددت الجوزاء خطأها.
هناك قضية أخرى لاحظتها مع سرد اللغات غير الإنجليزية وهي أن الجوزاء يعيش بشكل عشوائي الصوت وسرعة منتصف الطريق من خلال السرد. لقد كان الأمر متهورًا تمامًا ، وكان النطق ميكانيكيًا تمامًا ، ويختلف كثيرًا عن مهاراتها في المحادثة الإنجليزية التي تشبه الإنسان.

كما أن صراعات رؤية الآلة واضحة ضد الخطوط الأسلوبية. في مناسبات قليلة ، قامت بصق المعلومات الخاطئة بثقة ، وعندما يُطلب منها تصحيح نفسها ، أعرب الذكاء الاصطناعى عن عدم قدرته على العثور على أحدث المعلومات حول هذا الموضوع. هذه السيناريوهات نادرة ، لكن أخطاء الجوزاء موجودة لتبقى.
لتلخيص كل شيء ، أعتقد أن الجوزاء يعيش مع الكاميرا ومشاركة الشاشة هي واحدة من أكبر القفزات التي حققتها الذكاء الاصطناعى حتى الآن. إنها واحدة من أكثر التطبيقات مجزية من الذكاء الاصطناعى التوليدي حتى الآن. كل ما تحتاجه هو اندفاعة من التنوع وإصلاح متلازمة “كذاب واثق”.
من المؤكد أن الأمور على المسار الصحيح الآن ، وبشكل كبير ، ولكن لا تزال هناك عدد قليل من المعالم الحاسمة بعيدًا عن كونها رفيق AI المثالي للأحلام التقنية.