لقد كنا نعيش مع الصور التي تم إنشاؤها بواسطة الذكاء الاصطناعي لفترة من الوقت الآن، ولكن هذا الأسبوع، اتخذ بعض اللاعبين الرئيسيين بعض الخطوات الكبيرة إلى الأمام. على وجه الخصوص، أتحدث عن التحديثات المهمة لـ Midjourney، النموذج الجديد من Google، و Grok.
تُظهر كل شركة مدى تطور التكنولوجيا بسرعات مختلفة وفي اتجاهات مختلفة. ولا يزال المجال مفتوحًا أمام الجميع، وتوضح كل شركة مدى التقدم الذي أحرزته.
منتصف الرحلة تصل إلى الويب
دعونا نبدأ مع Midjourney، التي أطلقت بهدوء محرر ويب جديدًا في أواخر يوم الخميس والذي يجمع عددًا من أدوات معالجة الصور المفيدة في واجهة مستخدم واحدة.
في السابق، كانت الوظائف مثل إعادة التأطير وإعادة الطلاء (إضافة أصول تم إنشاؤها بواسطة الذكاء الاصطناعي إلى صورة موجودة أو تعديلها) والتحريك وتوسيع اللوحة القماشية (توسيع حدود الصورة وإنشاء محتوى لملئها) والتكبير تتطلب جميعها أداة خاصة بها لاستخدامها وكانت موجودة عبر قوائم متعددة، مما يتطلب من المبدعين التبديل باستمرار ذهابًا وإيابًا. تقدم واجهة المستخدم الجديدة هذه عملية تحرير أكثر تماسكًا وانسيابية، وهي انحراف ملحوظ عن بداية البرنامج على Discord.
أطلقت Midjourney للتو محرر الويب الخاص بها!!
إنها في الواقع واحدة من أروع الميزات التي أسقطوها منذ فترة
يتيح لك بشكل أساسي القيام بالرسم والتحريك والتكبير والمزيد في خطوة واحدة
قوية حقا حقا pic.twitter.com/Wgyi9ElE5N
— نيك سانت بيير (@nickfloats) 16 أغسطس 2024
صرح الرئيس التنفيذي لشركة Midjourney، ديفيد هولز، على Discord مؤخرًا، بأن محرر الويب الجديد مصمم لجعل تحرير الصور المولدة بواسطة الذكاء الاصطناعي أسهل وأكثر سلاسة. وكتب: “نعتقد أن هذا يجعل تحرير صورك على Midjourney أكثر سلاسة من ذي قبل وهو خطوة كبيرة إلى الأمام”.
ورغم أن Midjourney تواصل الانتقال من Discord إلى تطبيق قائم على الويب، فقد أعلنت الشركة أيضًا أنها ستعكس الرسائل من القنوات الشهيرة مثل “daily-theme” و”prompt-craft” و”general-1″ بين غرف الويب وقنوات Discord حتى يتمكن الأشخاص من متابعة هذه المواضيع من أي منصة يفضلونها. كما قدمت الشركة أداة تحديد جديدة تعمل مثل الفرشاة الرقمية، والتي حلت محل أدوات التحديد المربعة واللاسو.
المحرر الجديد متاح لجميع مستخدمي Midjourney الذين أنشأوا بالفعل أكثر من 10 صور على المنصة. وكانت ردود الفعل الأولية من مجتمع المبدعين إيجابية إلى حد كبير.
ويأتي المحرر بعد أسبوعين من إصدار Midjourney 6.1، الذي حسّن جودة الصورة وترابطها (مثل العدد الصحيح للأصابع)، بالإضافة إلى تحسين أوقات المعالجة وفهم دقة النص في مطالبات الصور بشكل كبير.
جروك-2 يطلق العنان للوحش
ويأتي تحديث Midjourney أيضًا بعد يومين فقط من إصدار Grok-2 بواسطة شركة xAI التابعة لـ Elon Musk، وهو الشيء الكبير التالي الذي حدث هذا الأسبوع.
تعتمد قدرات إنشاء الصور الخاصة بـ Grok على نموذج Flux.1 من Black Forrest Lab، والذي اكتسب شعبية متزايدة بسرعة بسبب جودة صورته الرائعة والاستخدام المجاني.
24 ساعة منذ إطلاق Grok 2.0 وإمكانياته في إنشاء الصور!
لقد قمت بإعداد هذه الأمثلة التسعة لك للاستفادة منها قدر الإمكان + الوصول إلى مكتبة لا نهاية لها من المطالبات!
(ضع إشارة مرجعية لهذا لقراءته لاحقًا) pic.twitter.com/7EDYSogfV2
— تيك هالا (@techhalla) 15 أغسطس 2024
إن الجدل الأكبر حول Grok-2 ليس فقط في جودته، التي هي جيدة جدًا، ولكن أيضًا في مبادئه التوجيهية غير المحددة على ما يبدو. على عكس العديد من مولدات الصور الأخرى التي تعمل بالذكاء الاصطناعي، يبدو أن Grok-2 لديه القليل جدًا من حيث المبادئ التوجيهية حول الملكية الفكرية والعنف والمحتوى الصريح الآخر. ليست هذه هي المرة الأولى التي يرى فيها مولد صور الذكاء الاصطناعي هذا النوع من الخطأ، ولكن مع Grok، يبدو الأمر مقصودًا، حيث وصفه ماسك بأنه “أكثر الذكاء الاصطناعي متعة في العالم”.
لقد اختبر الناس بالفعل حدود هذه التقنية وأنشأوا كل أنواع الصور المروعة والغريبة، والتي تذكرنا بالأيام الأولى لتوليد الصور بواسطة الذكاء الاصطناعي. ولكن إذا صدقنا خطاب ماسك، فإن افتقار Grok-2 إلى المبادئ التوجيهية يبدو مقصودًا وقد ينتهي به الأمر إلى تشكيل كيفية تطور هذه التقنية في المستقبل.
جوجل تدخل المنافسة مع Imagen 3
أخيرًا، أعلنت Google عن نموذجها الجديد Imagen 3 AI، والذي تم إصداره لجميع المستخدمين في الولايات المتحدة يوم الخميس. تصفه Google بأنه “نموذج النص إلى الصورة الأعلى جودة”، وهو الآن قادر على إنتاج “تفاصيل أفضل وإضاءة أكثر ثراءً وقليل من القطع الأثرية المشتتة للانتباه مقارنة بنماذجنا السابقة”. تقول Google أيضًا أن Imagen-3 أفضل في عرض النص ويأتي الآن في إصدارات مختلفة، مصممة للمهمة المطروحة، مثل شيء خفيف مثل رسم تخطيطي سريع أو شيء أكثر تفصيلاً ودقة عالية.
في الوقت الحالي، يتوفر Imagen 3 فقط من خلال AI Test Kitchen من Google، كجزء من ImageFX. وهو حاليًا في مرحلة تجريبية مغلقة، مما يعني أنه يتعين عليك الانضمام إلى قائمة الانتظار إذا لم تكن مشاركًا بالفعل.