قامت Google بترقية نموذج صورة الذكاء الاصطناعى للتو ، ويبدو في الواقع خطوة مهمة للغاية. قامت الشركة بطرح Gemini 2.5 Flash Image اليوم ، وهو تحديث كبير يعد بتوليد صور أكثر ذكاءً وأكثر مرونة.
يتيح النموذج الذي تمت ترقيته للمستخدمين إصدار مطالبات اللغة الطبيعية ليس فقط لإنشاء الصور ولكن أيضًا دمج الصور الحالية وإجراء تعديلات أكثر دقة دون إنشاء تشوهات غريبة. كما أنه ينقر على “المعرفة العالمية” لجوز الجوزاء لفهم ما يولده بشكل أفضل.
تأتي هذه الترقية في الوقت الذي تحاول فيه Google سد الفجوة مع قائد الصناعة ، Openai. في الماضي ، كان توليد الصور سائقًا رئيسيًا لمنظمة العفو الدولية. ارتفع استخدام ChatGPT في مارس عندما أطلقت الشركة مولد الصور الأصلي GPT-4O. أدت ميمات استوديو Ghibli الفيروسية الناتجة عن النموذج إلى ذوبان نماذج GPU الخاصة بالشركة ، وفقًا لمدير التنفيذي لشركة Openai Sam Altman. لدى ChatGPT حاليًا أكثر من 700 مليون مستخدم أسبوعي. وبالمقارنة ، كشف الرئيس التنفيذي لشركة Google Sundar Pichai في مكالمة أرباح الشركة في يوليو أن Gemini كان لديه 450 مليون مستخدم شهريًا ، لا يزال يتخلف عن Chatgpt.
https://www.youtube.com/watch؟v=BI-WI2Q_XOG
مع آخر تحديث له ، تقول Google إنه تم حل أحد أكبر الصداع في الذكاء الاصطناعي. حتى الآن ، كان الحفاظ على الأحرف أو الكائنات متسقة عبر تعديلات متعددة يمثل تحديًا كبيرًا لمولدات صور الذكاء الاصطناعي.
“يمكنك الآن وضع نفس الحرف في بيئات مختلفة ، أو عرض منتج واحد من زوايا متعددة في إعدادات جديدة ، أو إنشاء أصول عارية متسقة ، كل ذلك مع الحفاظ على الموضوع “. كتبت الشركة في منشور مدونة.
تقول Google إنه يمكن للمستخدمين الآن إجراء تعديلات محددة للغاية بمطالبة فقط. على سبيل المثال ، يمكن للمستخدمين طمس خلفية الصورة ، أو إزالة وصمة عار من تي شيرت ، أو تغيير وضع الشخص ، أو حتى إضافة لون إلى صورة بالأبيض والأسود.
حتى قبل إطلاقه الرسمي ، كان النموذج الجديد يدير رؤوسًا على منصة التقييم الجماعية Lmarena ، حيث ظهر مجهول تحت اسم “Nano-Banana”. شارك أحد مستخدمي X كيف استخدموا Nano-Banana لتغيير قميص Altman في صورة. كانت النتيجة جيدة بشكل مدهش. اليوم ، تقدمت Google إلى الأمام وادعت ملكية النموذج ، وكشفت أن Nano-Banana كان في الواقع صورة فلاش Gemini 2.5.
بالإضافة إلى كونه متاحًا على تطبيق Gemini ، يمكن الآن الوصول إلى النموذج الجديد للمطورين من خلال Gemini API و Google AI Studio و Vertex AI. قامت Google بالفعل ببناء العديد من تطبيقات القالب التي تستخدم النموذج الجديد على Google AI Studio ، ومساعد AI في ترميز الشركة ، وقال للمستخدمين يمكن أن يكونوا رمزًا فوقها.
وقالت الشركة أيضًا إن بعض المطورين قد جربوا بالفعل التطبيق لمعرفة كيف سيكون ذلك مفيدًا في سيناريوهات العالم الحقيقي ، مثل إنشاء بطاقات قائمة العقارات ، وشارات الموظفين ، وسخرات المنتجات.