Close Menu
تقنية نيوزتقنية نيوز

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    مقالات قد تهمك

    Prime Day هو وقت الذروة للحصول على سلسلة Robot Lawnmower Series I Navimow I – أفضل صفقة Navimow حتى الآن

    5 يوليو, 2025

    مصدر يؤكد أن الحملة التسويقية للعبة The Wolf Among Us 2 ستبدأ قريباً

    5 يوليو, 2025

    يشعر سام التمان بأنه “بلا مأوى سياسيًا” حيث يقترح Frenemy Musk طرفًا ثالثًا

    5 يوليو, 2025
    فيسبوك X (Twitter) الانستغرام
    • من نحن
    • سياسة الخصوصية
    • اتصل بنا
    فيسبوك X (Twitter) الانستغرام يوتيوب
    تقنية نيوزتقنية نيوز
    • الرئيسية
    • اخر الاخبار
    • هواتف ذكية
    • كمبيوتر
    • برامج وتطبيقات
    • شركات
      • ابل
      • سامسونج
      • جوجل
      • مايكروسوفت
      • أمازون
    • المزيد
      • الذكاء الإصطناعي
      • الأمن الإلكتروني
      • ألعاب
      • منوعات تقنية
    اشترك معنا
    تقنية نيوزتقنية نيوز
    الرئيسية » لقد اختبرت مستقبل توليد صور الذكاء الاصطناعي. إنه سريع بشكل مذهل.
    كمبيوتر

    لقد اختبرت مستقبل توليد صور الذكاء الاصطناعي. إنه سريع بشكل مذهل.

    فريق التحريربواسطة فريق التحرير23 مارس, 20251 زيارةلا توجد تعليقات
    شاركها فيسبوك تويتر بينتيريست لينكدإن Tumblr رديت تيلقرام البريد الإلكتروني
    شاركها
    فيسبوك تويتر لينكدإن بينتيريست البريد الإلكتروني

    واحدة من المشكلات الأساسية مع الذكاء الاصطناعى هي القوة العالية والحوسبة السمعة ، وخاصة بالنسبة للمهام مثل توليد الوسائط. على الهواتف المحمولة ، عندما يتعلق الأمر بالتشغيل أصليًا ، يمكن فقط عدد قليل من الأجهزة الثمنية مع السيليكون القوي تشغيل جناح الميزات. حتى عند تنفيذها على نطاق واسع على السحابة ، فهي علاقة غرامية.

    ربما عالجت Nvidia هذا التحدي بهدوء بالشراكة مع الأشخاص في معهد ماساتشوستس للتكنولوجيا وجامعة تسينغهوا. قام الفريق بإنشاء أداة هجينة لتوليد صور AI تسمى HART (محول الانحدار التلقائي المختلط) والتي تجمع بشكل أساسي بين أكثر تقنيات إنشاء صورة AI المستخدمة على نطاق واسع. النتيجة هي أداة سريعة النيران مع متطلبات حساب أقل بشكل كبير.

    فقط لإعطائك فكرة عن مدى سرعة ذلك ، طلبت ذلك لإنشاء صورة لببغاء يعزف على الجيتار. عاد مع الصورة التالية في حوالي ثانية. بالكاد أستطيع متابعة شريط التقدم. عندما دفعت نفس المطالبة قبل طراز Imagen 3 من Google في Gemini ، استغرق الأمر ما يقرب من 9 إلى 10 ثانية على اتصال إنترنت 200 ميغابت في الثانية.

    اختراق هائل

    عندما بدأت صور الذكاء الاصطناعى في صنع الأمواج لأول مرة ، كانت تقنية الانتشار وراء كل شيء ، حيث تعمل على تشغيل منتجات مثل مولد صور Dall-E من Openai ، و Google Imagen ، والانتشار المستقر. يمكن لهذه الطريقة إنتاج صور ذات مستوى عالٍ للغاية من التفاصيل. ومع ذلك ، فهو نهج متعدد الخطوات لإنشاء صور الذكاء الاصطناعى ، ونتيجة لذلك ، فهو بطيء ومكلف من الناحية الحسابية.

    النهج الثاني الذي اكتسب شعبية مؤخرًا هو النماذج التلقائية للعبور ، والتي تعمل بشكل أساسي بنفس الطريقة مثل chatbots وإنشاء صور باستخدام تقنية تنبؤ البكسل. إنه أسرع ، ولكن أيضًا طريقة أكثر عرضة للخطأ لإنشاء الصور باستخدام الذكاء الاصطناعي.

    العرض التوضيحي على الجهاز لـ HART: جيل مرئي فعال مع المحول التلقائي الهجين

    قام الفريق في معهد ماساتشوستس للتكنولوجيا دمج كلتا الطريقتين في حزمة واحدة تسمى هارت. يعتمد على نموذج تصدر التلقائي للتنبؤ بأصول الصورة المضغوطة كرمز منفصل ، في حين أن نموذج الانتشار الصغير يتعامل مع الباقي للتعويض عن فقدان الجودة. يقلل النهج العام من عدد الخطوات التي تنطوي عليها أكثر من عشرين إلى ثماني خطوات.

    يزعم الخبراء وراء هارت أنه “يمكن أن يولد صورًا تتطابق مع جودة نماذج الانتشار الحديثة أو تتجاوزها ، لكنهم يفعلون ذلك بشكل أسرع حوالي تسع مرات.” يجمع Hart بين نموذج الانحدار التلقائي مع نطاق معلمات 700 مليون ونموذج نشر صغير يمكنه التعامل مع 37 مليون معلمة.

    حل أزمة الحوسبة

    ومن المثير للاهتمام ، أن هذه الأداة الهجينة كانت قادرة على إنشاء صور تطابق جودة نماذج الرف العلوي بسعة 2 مليار معلمة. الأهم من ذلك ، تمكن هارت من تحقيق هذا المعلم بمعدل توليد صور أسرع تسع مرات ، بينما يتطلب موارد حسابية أقل بنسبة 31 ٪.

    وفقًا للفريق ، يتيح النهج المنخفض الحوسبة هارت أن يعمل محليًا على الهواتف وأجهزة الكمبيوتر المحمولة ، وهو فوز كبير. حتى الآن ، تتطلب منتجات السوق الجماعية الأكثر شعبية مثل ChatGPT و Gemini اتصال إنترنت لتوليد الصور مع حدوث الحوسبة في الخوادم السحابية.

    في مقطع الفيديو التجريبي ، عرض الفريق أنه يعمل أصلاً على جهاز كمبيوتر محمول من MSI مع معالج سلسلة Intel الأساسية وبطاقة رسومات NVIDIA Geforce RTX. هذا مزيج يمكنك العثور عليه في غالبية أجهزة الكمبيوتر المحمولة للألعاب هناك ، دون إنفاق ثروة ، أثناء وجوده في ذلك.

    Hart قادر على إنتاج صور نسبة العرض إلى ارتفاع 1: 1 بدقة محترمة 1024 × 1024 بكسل. مستوى التفاصيل في هذه الصور مثير للإعجاب ، وكذلك الاختلاف الأسلوبي ودقة المشهد. خلال اختباراتهم ، أشار الفريق إلى أن أداة AI الهجينة كانت في أي مكان بين ثلاث إلى ست مرات أسرع وعرضت أكثر من سبع مرات إنتاجية أعلى.

    الإمكانات المستقبلية مثيرة ، خاصة عند دمج إمكانيات صور هارت مع نماذج اللغة. يقول الفريق في معهد ماساتشوستس للتكنولوجيا: “في المستقبل ، يمكن للمرء أن يتفاعل مع نموذج توليدي موحد باللغة الرؤية ، ربما عن طريق مطالبة به إظهار الخطوات المتوسطة المطلوبة لتجميع قطعة من الأثاث”.

    إنهم يستكشفون هذه الفكرة بالفعل ، وحتى يخططون لاختبار نهج هارت في توليد الصوت والفيديو. يمكنك تجربتها على لوحة معلومات الويب الخاصة بـ MIT.

    بعض الحواف الخام

    قبل أن نغوص في نقاش الجودة ، ضع في اعتبارك أن هارت هو مشروع بحثي لا يزال في مراحله المبكرة. على الجانب الفني ، هناك بعض المتاعب التي أبرزها الفريق ، مثل النفقات العامة أثناء عملية الاستدلال والتدريب.

    يمكن إصلاح التحديات أو التغاضي عنها ، لأنها بسيطة في المخطط الأكبر للأشياء هنا. علاوة على ذلك ، بالنظر إلى الفوائد الهائلة التي يقدمها Hart من حيث كفاءة الحوسبة والسرعة والكمون ، فقد تستمر فقط دون أن تؤدي إلى أي مشاكل في الأداء الرئيسية.

    في الوقت القصير ، اختبرت هارت الاختبار ، لقد دهشت من وتيرة توليد الصور. بالكاد واجهت سيناريو حيث استغرقت أداة الويب المجانية أكثر من ثانيتين لإنشاء صورة. حتى مع طول المطالبات التي تمتد ثلاث فقرات (تقريبًا أكثر من 200 كلمة) ، تمكن هارت من إنشاء صور تلتزم بإحكام إلى الوصف.

    بصرف النظر عن الدقة الوصفية ، كان هناك الكثير من التفاصيل في الصور. ومع ذلك ، يعاني هارت من الإخفاقات النموذجية لأداة مولد صورة AI. إنه يكافح مع الأرقام ، والتصوير الأساسي مثل تناول المواد الغذائية ، واتساق الشخصية ، والفشل في التقاط المنظور.

    الواقعية في السياق البشري هي أحد المجالات التي لاحظت فيها إخفاقات صارخة. في مناسبات قليلة ، أصبح ببساطة مفهوم الكائنات الأساسية خاطئًا ، مثل الخلط بين الحلقة مع قلادة. لكن بشكل عام ، كانت هذه الأخطاء بعيدة ، قليلة ، ومن المتوقع بشكل أساسي. لا تزال مجموعة صحية من أدوات الذكاء الاصطناعى لا يمكنها الحصول على هذا بشكل صحيح ، على الرغم من وجودها هناك لفترة من الوقت الآن.

    بشكل عام ، أنا متحمس بشكل خاص للإمكانات الهائلة لهارت. سيكون من المثير للاهتمام معرفة ما إذا كان MIT و NVIDIA ينشئان منتجًا منه ، أو ببساطة اعتماد نهج توليد صور AI المختلط في منتج موجود. في كلتا الحالتين ، إنها لمحة عن مستقبل واعد للغاية.

    شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr البريد الإلكتروني
    السابقتم حظر Silent Hill F في أستراليا قبل الإصدار
    التالي وفر 72 ٪ على Top USA VPN + 2 أشهر مجانية

    المقالات ذات الصلة

    كمبيوتر

    آبل تكشف عن نظام macOS 26 Tahoe بتصميم جديد لحواسيب ماك

    10 يونيو, 2025
    كمبيوتر

    بالتعاون مع إنتل.. إطلاق وحش البطاقات الرسومية للذكاء الاصطناعي

    29 مايو, 2025
    كمبيوتر

    ساعدتني تطبيقات الويب 3 المجانية هذه على التوقف عن التسويف

    27 مايو, 2025
    كمبيوتر

    آبل تعتزم تغيير تصميم أنظمة ساعاتها الذكية

    27 مايو, 2025
    كمبيوتر

    Dell Canada Sale: التوفير المتاحة لأجهزة الكمبيوتر المحمولة ، أجهزة الكمبيوتر المكتبية ، Alienware

    26 مايو, 2025
    كمبيوتر

    اعتدت أن أتجاهل الأجهزة الطرفية الخاصة بي ، لكن هذه الأشياء الثلاثة جعلتني أغير رأيي

    26 مايو, 2025
    كمبيوتر

    4 بطاقات رسومات يجب عليك مراعاتها بدلاً من RTX 5060

    25 مايو, 2025
    كمبيوتر

    هذا HP Chromebook معروض للبيع مقابل 139 دولار بأسعار معقولة للغاية

    24 مايو, 2025
    كمبيوتر

    سامسونج تتيح تشغيل تطبيقاتها في كافة حواسيب ويندوز

    24 مايو, 2025
    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    Demo
    اخر الاخبار

    كيفية تسجيل مقاطع فيديو محمية بدون شاشة سوداء

    31 يوليو, 2024921 زيارة

    سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

    4 يوليو, 2024727 زيارة

    كل ما تريد معرفته عن Reacher الموسم الثالث

    6 مايو, 2024719 زيارة

    Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

    2 أبريل, 2024670 زيارة

    4 مزايا بطاريات السيليكون الكربونية للهواتف الذكية

    7 مارس, 2024512 زيارة

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    رائج الآن
    اخر الاخبار

    تبسيط احتياجات محاسبة عملك مع Intuit QuickBooks ، الآن 64 ٪ خصم

    فريق التحرير28 أبريل, 2025
    اخر الاخبار

    يحصل iPhone على أول تطبيق إباحي أصلي له

    فريق التحرير4 فبراير, 2025
    أمازون

    كل ما تريد معرفته عن Reacher الموسم الثالث

    فريق التحرير6 مايو, 2024
    رائج الآن

    تبسيط احتياجات محاسبة عملك مع Intuit QuickBooks ، الآن 64 ٪ خصم

    28 أبريل, 202540 زيارة

    يحصل iPhone على أول تطبيق إباحي أصلي له

    4 فبراير, 202532 زيارة

    كل ما تريد معرفته عن Reacher الموسم الثالث

    6 مايو, 202423 زيارة
    اختيارات المحرر

    Prime Day هو وقت الذروة للحصول على سلسلة Robot Lawnmower Series I Navimow I – أفضل صفقة Navimow حتى الآن

    5 يوليو, 2025

    مصدر يؤكد أن الحملة التسويقية للعبة The Wolf Among Us 2 ستبدأ قريباً

    5 يوليو, 2025

    يشعر سام التمان بأنه “بلا مأوى سياسيًا” حيث يقترح Frenemy Musk طرفًا ثالثًا

    5 يوليو, 2025

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    تقنية نيوز
    فيسبوك X (Twitter) الانستغرام يوتيوب لينكدإن تيكتوك
    • الرئيسية
    • سياسة الخصوصية
    • من نحن
    • اتصل بنا
    © 2025 تقنية نيوز. جميع حقوق النشر محفوظة.

    اكتب كلمة البحث ثم اضغط على زر Enter