لقد أثارت OpenAI إصدار Sora وأخرته مرارًا وتكرارًا لمدة عام تقريبًا. في يوم الثلاثاء، كشفت الشركة أخيرًا عن نسخة كاملة الوظائف من نموذج توليد الفيديو الجديد المخصص للاستخدام العام، وعلى الرغم من الضجة الأولية، لا يبدو أن المزيد والمزيد من المستخدمين الأوائل للإصدار قد أعجبوا بشكل مفرط. ولا أنا.
نقدم لكم Sora، نموذجنا لتحويل النص إلى فيديو.
يمكن لـ Sora إنشاء مقاطع فيديو تصل مدتها إلى 60 ثانية تتميز بمشاهد مفصلة للغاية وحركة الكاميرا المعقدة وشخصيات متعددة ذات مشاعر نابضة بالحياة. https://t.co/7j2JN27M3W
مستعجل: “جميل ، ثلجي … pic.twitter.com/ruTEWn87vf
– أوبن إيه آي (@OpenAI) 15 فبراير 2024
قدمت الشركة لأول مرة Sora في فبراير الماضي وحظيت بإشادة من النقاد بسبب عروض الفيديو الواقعية للغاية. كتبت OpenAI في مدونة إعلانها في ذلك الوقت: “يمكن لـ Sora إنشاء مقاطع فيديو تصل مدتها إلى دقيقة واحدة مع الحفاظ على الجودة المرئية والالتزام بمطالبة المستخدم”. “لا يفهم النموذج ما طلبه المستخدم في الموجه فحسب، بل يفهم أيضًا كيفية وجود هذه الأشياء في العالم المادي.”
يستمر OpenAI في إسقاط المزيد من مقاطع فيديو Sora المجنونة
تم إنشاؤها بواسطة الذكاء الاصطناعي بنسبة 100%
9 مقاطع فيديو تتحدى الواقع
1. الفيل مصنوع من أوراق الشجر pic.twitter.com/tPsHNGbFPS
— لينوس إيكنستام (@LinusEkenstam) 18 مارس 2024
أصدرت الشركة المزيد من اللقطات التي تم إنشاؤها بواسطة Sora في شهر مارس، وهذه المرة لفيل مصنوع من أوراق الشجر، مما يزيد من قدرات النموذج. واجه برنامج Sora بعد ذلك سلسلة من التأخيرات في التطوير، والتي ألقى كيفن ويل، كبير مسؤولي المنتجات في OpenAI، باللوم فيها في Reddit AMA مؤخرًا على “الحاجة إلى تحسين النموذج، والحصول على السلامة/انتحال الشخصية/الأشياء الأخرى بشكل صحيح، وتوسيع نطاق الحوسبة”. في الوقت نفسه، المعلومات ذكرت أن التكرارات المبكرة لـ Sora عانت من ضعف الأداء وواجهت صعوبة في الحفاظ على التركيز على مطالبات المستخدم، مما يتطلب ما يصل إلى 10 دقائق في العالم الحقيقي لإنشاء مقطع مدته دقيقة واحدة. تم أيضًا تسريب النموذج مؤخرًا عبر الإنترنت من قبل مجموعة من مختبري النسخة التجريبية الساخطين الذين اعترضوا على ممارسات “الغسل الفني” لـ OpenAI، ومع ذلك، قامت الشركة بسرعة بإزالة واجهة المستخدم غير المصرح بها للمجموعة من Hugging Face ردًا على ذلك.
بينما كانت شركة OpenAI تعمل على تعديل وتحسين أداء Sora، كانت منافسة الشركة تتناول غداءها. انتشرت Adobe's Firefly AI، وRunway's Gen 3 Alpha، وMeta's Movie Gen، وKling من Kuaishou Technology (ناهيك عن عدد لا يحصى من خيارات الاستخدام المجاني) عبر الإنترنت في العام الماضي، مع تقديم العديد منها مقاطع ذات جودة فائقة وأوقات استدلال أسرع مما سبق. وقد وعد OpenAI مرارا وتكرارا.
في يوم الثلاثاء، كشفت OpenAI رسميًا عن النسخة الجاهزة للإنتاج من Sora وأصدرتها لمشتركي Pro الذين يحصلون على 20 دولارًا شهريًا و200 دولار شهريًا. أو على الأقل فعلت الشركة ذلك لبضع ساعات. كما أشار المعلق التكنولوجي إد زيترون في Bluesky Wednesday، “بعد ساعات فقط – وربما أقل – بعد إعلان خروج Sora، توقفت OpenAI عن قبول تسجيلات الحسابات الجديدة دون جدول زمني واضح. قامت OpenAI بخداع وتبديل الوسائط التقنية بأكملها. من المستحيل أن تتمكن هذه الشركة من توفير مولد الفيديو الخاص بها للجمهور.
بالنسبة للأشخاص الذين تمكنوا من الوصول، كانت مقاطع الفيديو التي تمكن Sora من إنتاجها أقل من مثيرة للإعجاب. كما أشار ماركيز براونلي، شخصية اليوتيوب، خلال مقطع الفيديو العملي الخاص به مع العارضة، فقد تطلب الأمر عدة دقائق لإنشاء مقطع واحد بدقة 1080 بكسل مدته 20 ثانية، كما واجه صعوبة كبيرة في إنشاء أرجل الشخص وحركاته، مع وجود الجزء الأمامي والخلفي تقوم الأرجل الخلفية بتبديل الأوضاع بشكل غير طبيعي طوال المقطع. لا يحتاج المرء إلا إلى إلقاء نظرة على الفيديو الذي تم إنشاؤه أدناه للاعب جمباز وهو يتبادل أذرعه وأرجله ورأسه بسرعة أثناء سقوطه على السجادة لمعرفة ما يعنيه.
إليكم مقطع فيديو لرياضة الجمباز من إنتاج Sora
– بيتر لابوزا (@labuzamovies.bsky.social) 2024-12-11T17:35:23.989Z
ولم يتراجع مستخدم Bluesky، بيتر لابوزا، الذي نشر فيديو الجمباز، عن انتقاداته للعارضة، قائلا: “أنا آسف، ولكن إذا قمت بإنشاء مولد نص إلى فيديو وأخبرته” اجعل قطة تركض من خلال حقل ” و تعطيها صورة البداية، وتقف القطة ببساطة، ولا يعمل المولد الخاص بك.
كان لدى مستخدم Bluesky، كريس أوفنر، رأي مماثل، حيث أشار بسخرية إلى أن “Sora هو محرك فيزيائي يعتمد على البيانات” أثناء مشاركة مقطع مجنون تمامًا لمتزلج يتحدى معظم قوانين الفيزياء المعروفة، إن لم يكن كلها.
قام The Verge أيضًا بتجربة النموذج، متحسّرًا على حقيقة أنه لا يزال غير قادر على تجنب الشوائب القبيحة مثل “الأطراف الإضافية أو الأشياء المشوهة”.
“Sora هو محرك فيزيائي يعتمد على البيانات.”x.com/chrisoffner3…
– كريس أوفنر (@chrisoffner3d.bsky.social) 2024-12-10T12:42:53.674Z
لم يكن الجميع يكرهون سورا في الأفق، انتبهوا. أظهر مستخدم X Nathan Shipley ميزة “ريمكس” النموذج، والتي تمكن المستخدمين من إخفاء مقطع فيديو تم إنشاؤه لحركات الكائنات في العينة التي تم تحميلها. في هذه الحالة، قام بتحريك رأس الرافعة بنفس طريقة عمل المقص الذي قام بتصوير نفسه وهو يحمله.
اختبار سورا ريميكس: مقص للرافعة
كان التلميح هو “لقطة قريبة لطائر كرين فضولي ينظر حوله في مشهد طبيعي جميل بجوار البركة. يظهر رأس الطائر في اللقطة ثم يخرج.” pic.twitter.com/CvAkdkmFBQ
– ناثان شيبلي (@CitizenPlain) 10 ديسمبر 2024
لا توجد معلومات حتى الآن عن الموعد الذي ستتمكن فيه الشركة من إعادة فتح عمليات الاشتراك في الحساب بشكل موثوق لمستخدمي Sora المهتمين. ما إذا كان بإمكان OpenAI مغازلة هوليوود مع Sora في وضعها الحالي، كما فعلت Runway مؤخرًا مع Gen 3 وLionsgate، فلا يزال يتعين علينا رؤيته.
يبقى هناك شيء واحد مؤكد، وهو أن OpenAI، على الرغم من تقدمها الأولي في طفرة الذكاء الاصطناعي، يتم تجاوزها بسرعة من قبل بقية الصناعة، وإصدارات المنتجات الباهتة مثل ما رأيناه للتو مع Sora لن تؤدي إلا إلى الإضرار بسمعة الشركة.