أعلنت جوجل عن إطلاق نموذجها الجديد لتوليد الصور، Gemini 3 Pro Image، المعروف أيضًا باسم Nano Banana Pro، والذي يمثل تطوراً كبيراً في مجال الذكاء الاصطناعي البصري. يتيح هذا النموذج الجديد، المدمج ضمن منظومة Gemini، للمستخدمين إنشاء وتعديل الصور بدقة وتخصيص غير مسبوقين، معتمداً على دمج الذكاء الاستدلالي والمعرفة الواقعية، ويوفر تجربة متاحة عالميًا اعتبارًا من اليوم.
يأتي هذا الإطلاق بعد فترة وجيزة من الانتشار الواسع للجيل الأول من Nano Banana، ويستهدف Nano Banana Pro تلبية احتياجات المبدعين والطلاب والمتخصصين والمؤسسات على حد سواء. يوفر النموذج الجديد إمكانات متقدمة، بما في ذلك القدرة على دمج المعلومات من بحث جوجل في الوقت الفعلي لإنشاء صور دقيقة وحديثة.
جيل جديد من توليد الصور بالذكاء الاصطناعي
يعمل Nano Banana Pro على آلية “الارتكاز على البحث” (Search grounding)، مما يتيح له الاستفادة من نتائج بحث جوجل الحالية لضمان دقة المعلومات المستخدمة في الصور والنصوص التي يولدها. على سبيل المثال، يمكن للنموذج إنشاء خريطة طقس حية للقاهرة أو إنفوغرافيك حول مباراة رياضية مستندًا إلى البيانات المباشرة من بحث جوجل. هذه القدرة تميزه عن النماذج الأخرى التي تعتمد فقط على البيانات التي تم تدريبها عليها.
دقة في النصوص واللغات المتعددة
يتميز Nano Banana Pro بقدرته على إنتاج نصوص طويلة وواضحة داخل الصور، بالإضافة إلى تصميم الشعارات والخطوط الفنية بأنماط مختلفة. يدعم النموذج أيضاً لغات متعددة، مع إمكانية ترجمة محتوى الصور مباشرةً دون التأثير على جودة التصميم. تؤكد جوجل أن هذا النموذج هو الأفضل لديها حتى الآن في التعامل مع النصوص داخل الصور.
دمج الصور وتحريرها بشكل متقدم
يوفر Nano Banana Pro إمكانية دمج ما يصل إلى 14 صورة في صورة واحدة، مع الحفاظ على اتساق ملامح ما يصل إلى 5 أشخاص. هذه الميزة تجعل النموذج مثاليًا لتطبيقات متنوعة مثل صناعة المحتوى، والتسويق، وتصميم الواجهات، وحتى السينما والتحريك. بالإضافة إلى ذلك، يمكن للنموذج تحويل الرسومات الأولية إلى نماذج واقعية أو المخططات الهندسية إلى نماذج ثلاثية الأبعاد.
أدوات تحرير احترافية وجودة سينمائية
يتضمن Nano Banana Pro مجموعة من أدوات التحرير الاحترافية، بما في ذلك التحرير الدقيق لأجزاء محددة من الصورة، وتغيير زوايا الكاميرا، وضبط عمق المجال ونقطة التركيز، وتطبيق تصحيح لوني احترافي. كما يدعم النموذج محاكاة الإضاءة السينمائية (Chiaroscuro) وتحويل المشاهد بين النهار والليل، مع دعم دقة 2K و 4K ونسب أبعاد مختلفة.
الشفافية والأمان في المحتوى المولّد
تولي جوجل أهمية كبيرة لضمان الأمان والشفافية في المحتوى الذي يتم إنشاؤه باستخدام نماذج الذكاء الاصطناعي الخاصة بها. لتحقيق ذلك، قامت بدمج تقنية SynthID، وهي علامة رقمية غير مرئية تُضاف تلقائيًا إلى الصور المُولَّدة. يمكن للمستخدمين التحقق من مصدر الصورة باستخدام تطبيق Gemini. بالإضافة إلى ذلك، تستخدم جوجل علامات مائية مرئية لبعض المستخدمين وتعتمد بروتوكول C2PA لتعزيز معايير عالمية لتحديد المحتوى المولّد بالذكاء الاصطناعي.
تكامل واسع النطاق مع أدوات جوجل
بدأ Nano Banana Pro في الظهور في مجموعة متنوعة من منتجات جوجل، بما في ذلك تطبيق Gemini ووضع الذكاء الاصطناعي في بحث جوجل. كما أنه متاح في NotebookLM وأدوات احترافية مثل Google Ads و Google Slides و Google Vids. بالنسبة للمطورين، يتوفر النموذج عبر Gemini API و Google AI Studio ومنصة Google Antigravity و Vertex AI.
مستقبل الذكاء البصري مع Gemini 3 Pro Image
ترى جوجل أن Nano Banana Pro يمثل خطوة نحو “ذكاء بصري كامل” يتجاوز مجرد تحرير الصور. النموذج قادر على تحليل البيانات، وتلخيص المعلومات بصريًا، ودعم المبدعين والمصممين، وتسريع تطوير الحملات الإعلانية، وتحويل الأفكار إلى نماذج واقعية. تستهدف جوجل الاستمرار في تطوير هذه التقنيات وتعزيز مكانتها في سوق الذكاء الاصطناعي البصري التنافسي. من المتوقع أن تشهد منظومة Gemini المزيد من التحديثات والإضافات في الأشهر القادمة، مع التركيز على تحسين الأداء وتوسيع نطاق التطبيقات المتاحة.
