كشفت شركة جوجل عن تحديث جديد لأداة الذكاء اصطناعي لإنشاء الصور، Imagen 3، كالنموذج “الأعلى جودة” لتحول الأوامر النصية إلى صور واقعية ونابضة بالحياة”، كما تدعي الشركة.
عقدت جوجل مؤتمرها السنوي للمطورين Google I/O 2024 اعتبارًا من اليوم، الثلاثاء، وفي الكلمة الرئيسية التي تكشف خلالها الشركة عن جديد تقنياتها، كان الحديث يتمحور بشكل شبه كامل عن آخر ما توصلت له الشركة من قدرات الذكاء الاصطناعي التوليدي والميزات التي ستصل للمستخدمين قريبًا.
كشفت جوجل عن أداة Imagen 3 كجيل جديد من أداة الذكاء الاصطناعي لإنشاء الصور بجودة عالية، وتعد الشركة أن النموذج الجديد هو الأعلى جودة من حيث فهم ما يطلبه المستخدمين، واستخراج صورًا أكثر واقعية.
وتقول الشركة إن Imagen 3 يتعامل مع النص بشكل أفضل من ذي قبل، كما أنه أكثر ذكاءً في التعامل مع التفاصيل من الأوامر النصية الطويلة التي يكتبها المستخدم.
وفي سياق متصل، قالت جوجل إنها تعمل أيضًا مع فناني تسجيل الصوت مثل Wyclef Jean وBjorn لاختبار أداة صناعة الموسيقى بالذكاء الاصطناعي Music AI Sandbox، وهي مجموعة من الأدوات التي يمكن أن تساعد في إنشاء الأغاني والإيقاعات.
تحدثت الشركة بإيجاز عن المشروع وعرضت لمحة سريعة فقط عنه خلال حدث Google I/O 2024، ولكنها أثارت الاهتمام بين الحضور.
يأتي الإعلان عن الجيل الجديد من أداة صناعة الصور Imagen 3 جنبًا إلى جنب الكشف عن أداة Veo الجديدة المثيرة للاهتمام، وهي أداة جوجل الأولى لإنشاء مقاطع الفيديو بجودة عالية ودقة حتى 1080 بكسل.
بذلك ترفع جوجل من شدة التنافس مع OpenAI المطورة لـ ChatGPT والتي لديها بالفعل نماذج مثيرة في استخدام قدرات الذكاء الاصطناعي التوليدي في انشاء أعمال فنية مثل Sora لإنشاء مقاطع فيديو عالية الدقة، بالإضافة إلى نموذج Dall-E3 المتقدم لتقديم صورًا احترافية بجودة عالية من أوامر نصية فقط.
يُذكر أيضًا أن OpenAI كان لديها فعالية للمطورين أمس، الإثنين، كشفت خلاله عن الإصدار الجديد من نموذج الذكاء الاصطناعي الأحدث لها، والذي يحمل رقم GPT-4o والقادر على تقديم نتائج أفضل للمستخدمين.