يبدو أن مساعدي الذكاء الاصطناعي قديمون، أو هذا ما تريد Google منك أن تصدقه، لأننا في عصر وكلاء الذكاء الاصطناعي – وقد أثبت Google I/O 2024 ذلك بسرعة. رحب بـ Project Astra، وكيل الذكاء الاصطناعي الإبداعي الذي يتمتع بقدرات الرؤية والنص والكلام، مع القليل من الذاكرة وقدرات الوعي المكاني.
فكر في الأمر كعينين لهاتفك يمكنها فهم العالم من حولك. أشر بها إلى معادلة رياضية، وسوف تحلها. توجيه الكاميرا نحو قطة؟ ستقترح Astra اسمًا مناسبًا لمواء القطط. اسأله أين تركت سماعات الأذن الخاصة بك، وإذا رآها مستشعر الكاميرا، فسيقول شيئًا مثل، “لقد تركتها على الأريكة”.
يمكن لـ Astra فهم التعليمات البرمجية التي تظهر على الشاشة، وتحديد الأشياء وشرح ما تفعله، وتحديد المباني، والمزيد. يمكنك اعتبارها بمثابة Google Lens ولكن للعالم أجمع، ويمكنها فهم أي شيء أمام عدسة الكاميرا.
على عكس مساعد جوجل، لا تحتاج إلى المطالبة به. ما عليك سوى توجيه الكاميرا نحو أي شيء، ثم نطق الاستعلام الصوتي، وستقوم Astra بالشرح برد باللغة الطبيعية. تقول Google إنه سيتم طرح Project Astra عبر تطبيق Gemini في وقت لاحق من هذا العام.
وكيل الذكاء الاصطناعي الذي يرى كل شيء؟
إذا كان مشروع Astra يبدو مألوفًا، فذلك لأن OpenAI عرضت ميزة مشابهة لـ ChatGPT – مدعومًا بنموذج GPT-4o الجديد – قبل يوم واحد فقط. أداة OpenAI حاليًا في مرحلة الفريق الأحمر لاختبار السلامة وسيتم إصدارها على مراحل، بدءًا من مشتركي ChatGPT Plus.
لن تقول Google ما إذا كان Astra سيكون لها ثمن أم لا. ولكن نظرًا لشبه عفوية الاستجابات، ونوع معالجة البيانات المرئية المتضمنة، والقطع التوليدية المطلوبة لتقديم استجابة ذات معنى، فمن غير المرجح أن يتم تقديم Astra كميزة مجانية بسبب متطلبات الحوسبة.
أفضل مثال على ذلك هو اشتراك Google One AI Premium، والذي يخفي بالفعل بعض التجارب الجديدة التي تدعمها Gemini خلف نظام حظر الاشتراك غير المدفوع. ولكن حتى الآن، يبدو Astra وكأنه أكثر ابتكارات الذكاء الاصطناعي المدهشة التي عرضتها Google منذ أن أبهرت العالم بقدرات الدوبلكس قبل بضع سنوات.