أعلنت Midjourney عن إصدار Alpha لنموذج V7 Image Generation لاختبار من قبل مجتمع الذكاء الاصطناعي. يحزم النموذج الجديد تحسينات في الفهم النصي ، وجودة الصورة ، والتماسك للميزات.
“V7 هو نموذج مذهل. إنه أكثر ذكاءً مع مطالبات النص ، ومطالبات الصورة تبدو رائعة ، وجودة الصورة أعلى بشكل ملحوظ مع القوام الجميلة ، والأجسام ، واليدين ، والكائنات من جميع الأنواع لديها بشكل أفضل تماسك على جميع التفاصيل” ، أوضح Midjourney.
الابتكار الرئيسي في V7 هو التنشيط الافتراضي لتخصيص النموذج. يجب على المستخدمين إلغاء قفل هذه الميزة في البداية ، وهي عملية تستغرق حوالي خمس دقائق. يمكن تبديل هذا التخصيص أو إيقاف تشغيله في أي وقت ، ويهدف إلى تحسين قدرة الذكاء الاصطناعي بشكل كبير على تفسير رغبات المستخدم والتفضيلات الجمالية. يعتقد Midjourney أن هذه الميزة تحدد معيارًا جديدًا لفهم نية المستخدم.
تقدم Midjourney أيضًا ميزة جنبًا إلى جنب مع نموذج توليد الصور V7 يسمى “وضع المسودات” ، والذي يعد بإنشاء صور أسرع بعشر مرات وعلى نصف التكلفة.
مكنت هذه السرعة المتزايدة Midjourney من تنفيذ “وضع محادثة” فريد من نوعه على واجهة الويب الخاصة به. يمكن للمستخدمين الآن إرشاد النظام لإجراء تغييرات ، مثل استبدال القط بالبومة أو تغيير الوقت من اليوم إلى الليل ، وسيقوم الذكاء الاصطناعي تلقائيًا بضبط المطالبة وبدء مهمة توليد الصور الجديدة.
يشتمل وضع المسودة أيضًا على وظائف الإدخال الصوتي. بالضغط على زر الميكروفون ، يمكن للمستخدمين توضيح أفكارهم شفهياً ومراقبة الصور عند إنشاؤها في الوقت الفعلي القريب:
يعتقد Midjourney أن وضع المسودة يوفر طريقة غير مسبوقة لتحسين المفاهيم الإبداعية. إذا كانت صورة تم إنشاؤها جذابة ، فيمكن للمستخدمين تحديد خيارات “تحسين” أو “تختلف” لإعادة تقديمها بكامل الجودة. على الرغم من أن الصور ذات الجودة المنخفضة مقارنة بالوضع القياسي ، إلا أن سلوكها وخصائصها الجمالية لا تزال متسقة.
سيكون نموذج توليد الصور V7 من Midjourney متاحًا في البداية في وضعين للسرعة: Turbo والاسترخاء. يخضع وضع السرعة القياسي حاليًا لمزيد من التحسين ومن المتوقع أن يتم إصداره قريبًا. أوضحت Midjourney أن Jobs Turbo ستكلف ضعف الوظيفة القياسية ، في حين أن مسودة الوظائف ستكلف نصف المبلغ.
قدمت الشركة أيضًا تحديثات على وظائف أخرى. ستعود ميزات مثل الارتفاع والتحرير والاستعادة في البداية إلى استخدام طراز V6 ، مع المخطط للتحديثات للمستقبل. تعمل وظائف لوحات المزاج و SREF حاليًا ، ومن المتوقع أن تتحسن الأداء مع التحديثات اللاحقة.
بالنظر إلى المستقبل القريب ، حدد Midjourney جدول تطوير نشط. يمكن للمستخدمين توقع ميزات جديدة كل أسبوع إلى أسبوعين لمدة 60 يومًا القادمة. ستكون الميزة القادمة الهامة عبارة عن سعة مرجعية جديدة لـ V7 وقدرة مرجعية للكائن.
أخيرًا ، نصحت Midjourney المستخدمين بأن V7 هو نموذج جديد تمامًا مع نقاط القوة الفريدة والضعف المحتملة. أنها تشجع التجريب والتعليقات على قدراتها ، لتذكير المستخدمين بأنها قد تتطلب تقنيات المطالبة المختلفة مقارنة بالإصدارات السابقة.
(الصورة الائتمان: Midjourney)
انظر أيضا: Tony Blair Institute AI Copyright Report Sparks Backleash

هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الكبيرة من قادة الصناعة؟ تحقق من AI و Big Data Expo الذي يقام في أمستردام ، كاليفورنيا ، ولندن. تم تحديد الحدث الشامل مع الأحداث الرائدة الأخرى بما في ذلك مؤتمر الأتمتة الذكي ، و blockx ، وأسبوع التحول الرقمي ، ومعرض Cyber Security & Cloud.
استكشاف أحداث وندوات الويب القادمة الأخرى التي تعمل بها TechForge هنا.