لقد وعدت شركة OpenAI بإصدار نموذج مولد الفيديو من الجيل التالي، Sora، منذ فبراير. وفي يوم الاثنين، أسقطت الشركة أخيرًا نسخة عاملة منه كجزء من حدث “12 يومًا من OpenAI”.
وقال سام ألتمان، الرئيس التنفيذي لشركة OpenAI، خلال البث المباشر للشركة: “هذا جزء مهم من خارطة طريق AGI الخاصة بنا”.
وفقًا لفريق OpenAI، سيتم توفير Sora لمشتركي Plus وPro في الولايات المتحدة وحول العالم بدءًا من بعد ظهر يوم الاثنين.
وبحسب ما ورد حصل مستخدم YouTube Marquis Brownlee على وصول مبكر إلى منشئ الفيديو وأصدر مراجعة مختصرة على قناته صباح يوم الاثنين. يبدو أن Sora لم يتم بناؤه فوق GPT-4، كما هو الحال مع جميع أدوات OpenAI التوليدية الأخرى تقريبًا. النموذج غير متاح من خلال موقع ChatGPT القياسي، ولكن بدلاً من ذلك من خلال Sora.com (الذي لا يزال غير متاح حتى تاريخ نشر هذا المنشور).
النموذج قادر على إنشاء مقاطع فيديو بدقة تتراوح من 480 بكسل إلى 1080 بكسل وبأطوال تتراوح من 5 إلى 20 ثانية، إما من المطالبات النصية أو الصور المرجعية. كما أنه قادر على تحرير وتوسيع مقاطع الفيديو الموجودة. سيُسمح لمشتركي ChatGPT Plus بما يصل إلى 50 جيلًا من المقاطع بدقة تصل إلى 720 بكسل شهريًا، وعدد أقل من مقاطع الفيديو بدقة أعلى، يبلغ طول كل منها خمس ثوانٍ. سيتم السماح للمستخدمين المحترفين بأجيال غير محدودة بجميع درجات الدقة والمدد التي تصل إلى 20 ثانية. بالإضافة إلى أدوات التحرير، يقدم Sora أيضًا ميزة “القصة المصورة” التي ستمكن المبدعين من الجمع بين مطالبات متعددة في مشهد سينمائي واحد.
يشير براونلي إلى أن النموذج يحتاج إلى “بضع دقائق” لإنشاء مقطع بدقة 1080 بكسل، ولكنه يشير إلى أن “هذا أيضًا، في الوقت الحالي، عندما لا يستخدمه أي شخص آخر تقريبًا. أتساءل نوعًا ما عن المدة التي سيستغرقها الأمر عندما يكون هذا مفتوحًا ليستخدمه أي شخص. ويشير براونلي أيضًا إلى أن النموذج يواجه صعوبة كبيرة في توليد الأرجل وحركاتها بشكل صحيح، حيث تتبادل الأرجل الأمامية والخلفية مواضعها بطرق غير طبيعية وغير مفهومة.
هدية العيد التي نقدمها لك: سورا هنا. https://t.co/JQKGgLAy6E pic.twitter.com/0c0DLl6Udf
– أوبن إيه آي (@OpenAI) 9 ديسمبر 2024
على عكس Grok 2، سوف يحد Sora مما يمكن لمستخدميه إنشاؤه ويحظر صراحة إنشاء مواضيع محمية بحقوق الطبع والنشر، والأشخاص الذين تقل أعمارهم عن 18 عامًا، وأي شيء يحتوي على عنف أو “موضوعات صريحة”.
على الرغم من مكانة OpenAI الرائدة في صناعة الذكاء الاصطناعي، فقد عانت Sora من التأخير طوال فترة تطويرها، مما مكن المنافسين مثل نماذج Gen-3 alpha من Runway، وKling من Kuaishou Technology، وMeta's Movie Gen من التغلب عليها في السوق. تم أيضًا تسريب Sora مؤخرًا (ولكن لفترة وجيزة) علنًا من قبل مجموعة من مختبري النسخة التجريبية، الذين اتهموا الشركة بـ “غسل الفن” لقدرات النموذج.