أطلقت شركة Minimax الناشئة المدعومة من Alibaba وTencent، والتي تعد واحدة من “نمور الذكاء الاصطناعي” في الصين، نموذجها Video-01 لتحويل النص إلى فيديو، والذي يمكنه إنشاء صور دقيقة للغاية للبشر، بما في ذلك حركات أيديهم. كشفت Minimax عن الأداة الجديدة يوم السبت في مؤتمر المطورين الافتتاحي في شنغهاي.
أداة فيديو جديدة تعتمد على الذكاء الاصطناعي أطلقتها اليوم شركة Minimax، بدعم من المستثمرين الرئيسيين Alibaba Group وTencent. 🎞️
قم بإلقاء نظرة على فيلمهم الرسمي للذكاء الاصطناعي Magic Coin🪙، والذي تم إنشاؤه بالكامل باستخدام تحويل النص إلى فيديو.
🥁جربه مجانًا الآن: https://t.co/Kl1avPXkFL pic.twitter.com/df14ZVq1Es— جوني لاو (@JunieLauX) 31 أغسطس 2024
يتيح Video-01 للمستخدمين إنشاء مقاطع فيديو مدتها 6 ثوانٍ بدقة 1280 × 720 بمعدل 25 إطارًا في الثانية (fps) باستخدام مطالبات نصية، ويُقال إنه في حوالي دقيقتين. في المؤتمر، أشار الرئيس التنفيذي لشركة Minimax، يان جونجي، إلى أن هذا هو الإصدار الأول فقط من النموذج وأن التحديثات المستقبلية ستشمل القدرة على إنشاء مقاطع فيديو من الصور وتحرير مقاطع الفيديو التي تم إنشاؤها، وفقًا لـ صحيفة ساوث تشاينا مورنينج بوست وقال للصحفيين “لقد حققنا بالفعل تقدما كبيرا في توليد نماذج الفيديو، وبناء على التقييمات والنتائج الداخلية، فإن أداءنا أفضل من أداء Runway في توليد مقاطع الفيديو”.
لتجربة Video-01 بنفسك، توجه إلى موقع Video-01. أثناء كتابة هذا المقال، كان الموقع مليئًا بالمستخدمين، لذا استغرقت عملية إنشاء الفيديو ما يقرب من 5 دقائق ولكنها لم تتطلب مني إدخال رقم هاتف محمول أو تسجيل الدخول لاستخدامه. وكما هو الحال مع أدوات الذكاء الاصطناعي الرائدة الأخرى مثل Kling وRunway، يمكنك إملاء حركات الكاميرا السينمائية في موجه النص الخاص بك. كانت جودة الفيديو الناتجة جيدة جدًا، وشبيهة بالحياة بشكل لافت للنظر، ولم تقدم أي هلوسات بصرية كبيرة توجد عادةً في أدوات الذكاء الاصطناعي المجانية المماثلة. يمكن أيضًا تنزيل الفيديو كملف .MP4.
انضم Video-01 إلى سوق توليد الفيديو المزدحم بشكل متزايد، حتى بدون وصول Sora الذي طال انتظاره من OpenAI. أصدرت شركتان أخريان من “النمور”، Shengshu AI و Zhipu AI (تقدر قيمتهما بأكثر من مليار دولار)، أدوات تحويل النص إلى فيديو الخاصة بهما في يوليو، كما فعلت Kaishou Industries مع Kling.AI. كما أصدرت Byte Dance مؤخرًا تطبيق Jimeng لتحويل النص إلى فيديو على متجري تطبيقات Apple وAndroid، على الرغم من أنه متاح فقط للمستخدمين في الصين. في الولايات المتحدة، سيتعين على Minimax التنافس مع أمثال Dream Machine من Luma Labs و Gen-3 من Runway.