تعمل Lightricks على رفع مستوى الرهان لإنشاء مقاطع فيديو سريعة وتكرارها باستخدام أحدث نموذج للذكاء الاصطناعي. تدعي الشركة أن الطراز الأساسي LTX-2 الذي تم إصداره حديثًا يمكنه إنشاء محتوى جديد بشكل أسرع من سرعة التشغيل، بالإضافة إلى أنه يرفع مستوى الدقة والجودة.
يمكن لـ LTX-2 مفتوح المصدر إنشاء مقطع فيديو منمق وعالي الدقة مدته ست ثوانٍ في خمس ثوانٍ فقط دون أي تنازل عن الجودة، مما يمكّن المبدعين من ضخ محتوى احترافي بشكل أسرع بكثير من ذي قبل.
إنه إنجاز مثير للإعجاب، ولكنه ليس العامل الوحيد الذي يميز LTX-2 عن الآخرين. فهو يجمع بين تركيب الصوت والفيديو الأصلي مع شفافية مفتوحة المصدر، وإذا كان المستخدمون على استعداد للانتظار بضع ثوانٍ فقط، فيمكنهم تحسين مخرجاتهم إلى دقة 4K بمعدل يصل إلى 48 إطارًا في الثانية، كما تقول الشركة. والأفضل من ذلك، أنه يمكن للمبدعين تشغيل البرنامج على وحدات معالجة الرسومات المخصصة للمستهلكين، مما يقلل بشكل كبير من تكاليف الحوسبة الخاصة بهم.
نماذج الانتشار تأتي في سن الرشد
LTX-2 هو ما يُعرف بنموذج الانتشار، والذي يعمل عن طريق إضافة “الضوضاء” بشكل تدريجي إلى المحتوى الذي تم إنشاؤه ثم تقليل هذا التشويش حتى يشبه الإخراج أصول الفيديو التي تم تدريب النموذج عليها.
باستخدام LTX-2، قامت Lightricks بتسريع عملية النشر، حتى يتمكن المبدعون من تكرار أفكارهم من خلال إخراج معاينات مباشرة على الفور تقريبًا. كما أن النموذج قادر أيضًا على إنشاء صوت مصاحب في نفس الوقت – سواء كان مقطعًا صوتيًا أو حوارًا أو مؤثرات صوتية محيطة – مما يؤدي إلى تسريع سير العمل الإبداعي بشكل كبير.
هذا أمر مهم، كما كان من قبل، كان على المبدعين استحضار أي صوت بشكل منفصل عن الفيديو، ثم قضاء بعض الوقت في تجميعه معًا والتأكد من وجود تزامن مثالي. لقد تم الاحتفال بنماذج Veo من Google لتكاملها القوي مع توليد الصوت المتزامن، لذا فإن هذه الإمكانات الجديدة في LTX تعمل على تعزيز فكرة أن تقنية Lightricks تتساوى مع حافة النزيف.
عندما يتعلق الأمر بخيارات الوصول، لا تزال Lightricks توفر للمبدعين قدرًا كبيرًا من المرونة مع LTX-2. تستهدف منصة LTX Studio الرائدة في الشركة المحترفين، الذين، في بعض الحالات، على استعداد للتضحية ببعض السرعة لإنشاء مقاطع فيديو بأعلى جودة. مع معدلات المعالجة الأبطأ قليلاً، سيكونون قادرين على إخراج مقاطع الفيديو بدقة 4K الأصلية بمعدل يصل إلى 48 إطارًا في الثانية، مما يؤدي إلى الإنشاء بنفس المعيار المتوقع من الإنتاج السينمائي، كما يدعي Lightricks.
توفر المنصة مجموعة واسعة من عناصر التحكم الإبداعية، مما يؤثر على معلمات النموذج القابلة للتخصيص. سيتم الإعلان عن مزيد من التفاصيل حول هذه العناصر قريبًا، ولكن يجب أن تتضمن عناصر التحكم في الوضعية والعمق، وإنشاء فيديو إلى فيديو، وبدائل العرض – ترقب تاريخ الإصدار، في وقت لاحق من هذا الخريف.
يعتقد المؤسس المشارك لشركة Lightricks والرئيس التنفيذي Zeev Farbman أن القدرات المحسنة لـ LTX-2 توضح مدى وصول نماذج الانتشار إلى مرحلة النضج أخيرًا. وقال في بيان له إن LTX-2 هو: “محرك الذكاء الاصطناعي الإبداعي الأكثر اكتمالًا وشمولاً الذي بنيناه على الإطلاق، ويجمع بين الصوت والفيديو المتزامنين، ودقة 4K، وسير العمل المرن، والكفاءة الجذرية.”
قال: “إن هذا ليس برنامجًا بخاريًا أو عرضًا بحثيًا”. “إنه إنجاز حقيقي في مجال توليد الفيديو.”
معلما رئيسيا
مع LTX-2، تثبت Lightricks أنها في طليعة توليد الفيديو بالذكاء الاصطناعي، حيث تأتي المنصة على خلفية عدد من الابتكارات الصناعية الأولى في نماذج LTXV السابقة.
في يوليو، أصبحت عائلة طرازات LTXV الخاصة بالشركة، بما في ذلك LTXV-2B وLTXV-13B، أول عائلة تدعم إنشاء الفيديو الطويل، والذي أعقب تحديثًا أدى إلى تمديد الإخراج إلى ما يصل إلى 60 ثانية. وبهذا، أصبح إنتاج فيديو الذكاء الاصطناعي “موجهًا حقًا”، حيث يتمكن المستخدمون من البدء بمطالبة أولية، وإضافة المزيد من المطالبات في الوقت الفعلي أثناء بث الفيديو مباشرة.
يتمتع LTXV-13B بالفعل بسمعة طيبة لكونه واحدًا من أقوى نماذج إنشاء الفيديو المتوفرة، حتى قبل ذلك التحديث الذي مدته دقيقة واحدة. تم إطلاقه في شهر مايو، وكان أول منصة في الصناعة تدعم العرض متعدد النطاق، مما يتيح للمستخدمين تحسين مقاطع الفيديو الخاصة بهم بشكل تدريجي من خلال حث النموذج على إضافة المزيد من الألوان والتفاصيل، خطوة بخطوة، بنفس الطريقة التي يقوم بها رسامو الرسوم المتحركة المحترفون “بطبقة” تفاصيل إضافية فوق عملهم في عمليات الإنتاج التقليدية.
تم تدريب نموذج 13B على البيانات المرخصة من Getty وShutterstock. تعد شراكات الشركة مع عمالقة المحتوى هذه مهمة، ليس فقط لجودة بيانات التدريب، ولكن أيضًا لأسباب أخلاقية؛ تعتبر مخرجات النماذج أقل إشكالية بكثير من حيث حقوق الطبع والنشر، وهي القضية التي ابتليت بها العديد من إبداعات نماذج الذكاء الاصطناعي الأخرى.
أصدرت Lightricks أيضًا نسخة مقطرة من LTXV-13B تعمل على تبسيط وتسريع عملية النشر، مما يعني أنه يمكن إنشاء المحتوى في أقل من أربع إلى ثماني خطوات. تدعم النسخة المقطرة أيضًا LoRAs، مما يعني أنه يمكن للمستخدمين ضبطها بدقة لإنشاء محتوى أكثر انسجامًا مع النمط الجمالي للمشروع.
نماذج الفواتير المبتكرة
مثل تلك النماذج السابقة، سيتم إصدار LTX-2 بموجب ترخيص مفتوح المصدر، مما يجعله بديلاً قابلاً للتطبيق لسلسلة نماذج Wan2 من Alibaba. وشددت Lightricks على أنها مفتوحة المصدر حقًا، على عكس مجرد “الوصول المفتوح”، مما يعني أن الأوزان ومجموعات البيانات وجميع الأدوات المدربة مسبقًا ستكون متاحة على GitHub، جنبًا إلى جنب مع النموذج نفسه.
يتوفر LTX-2 للمستخدمين في LTX Studio ومن خلال واجهة برمجة التطبيقات (API) الخاصة به اعتبارًا من الآن، ومن المقرر إصدار الإصدار مفتوح المصدر في نوفمبر.
بالنسبة لأولئك الذين يفضلون استخدام الإصدار المدفوع عبر واجهة برمجة التطبيقات، تقدم Lightricks أسعارًا مرنة، حيث تبدأ التكاليف من 0.04 دولار فقط في الثانية للإصدار الذي ينشئ مقاطع فيديو عالية الدقة في خمس ثوانٍ فقط. يوازن الإصدار Pro بين السرعة والأداء، وهنا تبدأ الأسعار من 0.07 دولار في الثانية. تبلغ تكلفة الإصدار Ultra 0.12 دولارًا أمريكيًا في الثانية لإنشاء الفيديو بدقة 4K بمعدل 48 إطارًا في الثانية، بالإضافة إلى الصوت عالي الدقة. تختلف الأسعار أيضًا وفقًا للدقة، حيث يمكن للمستخدمين الاختيار بين 720p و1080p و2K و4K.
تدعي Lightricks أنه بفضل كفاءة معالجة النموذج، فإن تسعيره يجعل LTX-2 أرخص بنسبة تصل إلى 50% من النماذج المنافسة، مما يجعل المشاريع الممتدة أكثر جدوى من الناحية الاقتصادية، ولكن مع تكرار أسرع وجودة أعلى من الأجيال السابقة. وبدلاً من ذلك، سيتمكن المستخدمون من استخدام النموذج عن طريق تنزيل الإصدار مفتوح المصدر وتشغيله على وحدات معالجة الرسومات المخصصة للمستهلك بعد وصوله إلى GitHub الشهر المقبل.
مصدر الصورة: أونسبلاش
