Close Menu
تقنية نيوزتقنية نيوز

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    مقالات قد تهمك

    تقرير: كابكوم تعتزم إحياء سلسلتي “ميجا مان” و”ديفل ماي كراي” وتُهمل “داينو كرايسس”.

    9 ديسمبر, 2025

    ترامب يزعم أن نفيديا تستطيع بيع شريحة H200 للصين.

    9 ديسمبر, 2025

    “جائزة الابتكار العالمية في المياه” تتوج أفضل 14 حلًا مبتكرًا لمواجهة ندرة المياه وتغير المناخ

    9 ديسمبر, 2025
    فيسبوك X (Twitter) الانستغرام
    • من نحن
    • سياسة الخصوصية
    • اتصل بنا
    فيسبوك X (Twitter) الانستغرام يوتيوب
    تقنية نيوزتقنية نيوز
    • الرئيسية
    • اخر الاخبار
    • هواتف ذكية
    • كمبيوتر
    • برامج وتطبيقات
    • شركات
      • ابل
      • سامسونج
      • جوجل
      • مايكروسوفت
      • أمازون
    • المزيد
      • الذكاء الإصطناعي
      • الأمن الإلكتروني
      • ألعاب
      • منوعات تقنية
    اشترك معنا
    تقنية نيوزتقنية نيوز
    الرئيسية » لقد اختبرت مستقبل توليد صور الذكاء الاصطناعي. إنه سريع بشكل مذهل.
    كمبيوتر

    لقد اختبرت مستقبل توليد صور الذكاء الاصطناعي. إنه سريع بشكل مذهل.

    فريق التحريربواسطة فريق التحرير23 مارس, 20251 زيارةلا توجد تعليقات
    شاركها فيسبوك تويتر بينتيريست لينكدإن Tumblr رديت تيلقرام البريد الإلكتروني
    شاركها
    فيسبوك تويتر لينكدإن بينتيريست البريد الإلكتروني

    واحدة من المشكلات الأساسية مع الذكاء الاصطناعى هي القوة العالية والحوسبة السمعة ، وخاصة بالنسبة للمهام مثل توليد الوسائط. على الهواتف المحمولة ، عندما يتعلق الأمر بالتشغيل أصليًا ، يمكن فقط عدد قليل من الأجهزة الثمنية مع السيليكون القوي تشغيل جناح الميزات. حتى عند تنفيذها على نطاق واسع على السحابة ، فهي علاقة غرامية.

    ربما عالجت Nvidia هذا التحدي بهدوء بالشراكة مع الأشخاص في معهد ماساتشوستس للتكنولوجيا وجامعة تسينغهوا. قام الفريق بإنشاء أداة هجينة لتوليد صور AI تسمى HART (محول الانحدار التلقائي المختلط) والتي تجمع بشكل أساسي بين أكثر تقنيات إنشاء صورة AI المستخدمة على نطاق واسع. النتيجة هي أداة سريعة النيران مع متطلبات حساب أقل بشكل كبير.

    فقط لإعطائك فكرة عن مدى سرعة ذلك ، طلبت ذلك لإنشاء صورة لببغاء يعزف على الجيتار. عاد مع الصورة التالية في حوالي ثانية. بالكاد أستطيع متابعة شريط التقدم. عندما دفعت نفس المطالبة قبل طراز Imagen 3 من Google في Gemini ، استغرق الأمر ما يقرب من 9 إلى 10 ثانية على اتصال إنترنت 200 ميغابت في الثانية.

    اختراق هائل

    عندما بدأت صور الذكاء الاصطناعى في صنع الأمواج لأول مرة ، كانت تقنية الانتشار وراء كل شيء ، حيث تعمل على تشغيل منتجات مثل مولد صور Dall-E من Openai ، و Google Imagen ، والانتشار المستقر. يمكن لهذه الطريقة إنتاج صور ذات مستوى عالٍ للغاية من التفاصيل. ومع ذلك ، فهو نهج متعدد الخطوات لإنشاء صور الذكاء الاصطناعى ، ونتيجة لذلك ، فهو بطيء ومكلف من الناحية الحسابية.

    النهج الثاني الذي اكتسب شعبية مؤخرًا هو النماذج التلقائية للعبور ، والتي تعمل بشكل أساسي بنفس الطريقة مثل chatbots وإنشاء صور باستخدام تقنية تنبؤ البكسل. إنه أسرع ، ولكن أيضًا طريقة أكثر عرضة للخطأ لإنشاء الصور باستخدام الذكاء الاصطناعي.

    العرض التوضيحي على الجهاز لـ HART: جيل مرئي فعال مع المحول التلقائي الهجين

    قام الفريق في معهد ماساتشوستس للتكنولوجيا دمج كلتا الطريقتين في حزمة واحدة تسمى هارت. يعتمد على نموذج تصدر التلقائي للتنبؤ بأصول الصورة المضغوطة كرمز منفصل ، في حين أن نموذج الانتشار الصغير يتعامل مع الباقي للتعويض عن فقدان الجودة. يقلل النهج العام من عدد الخطوات التي تنطوي عليها أكثر من عشرين إلى ثماني خطوات.

    يزعم الخبراء وراء هارت أنه “يمكن أن يولد صورًا تتطابق مع جودة نماذج الانتشار الحديثة أو تتجاوزها ، لكنهم يفعلون ذلك بشكل أسرع حوالي تسع مرات.” يجمع Hart بين نموذج الانحدار التلقائي مع نطاق معلمات 700 مليون ونموذج نشر صغير يمكنه التعامل مع 37 مليون معلمة.

    حل أزمة الحوسبة

    ومن المثير للاهتمام ، أن هذه الأداة الهجينة كانت قادرة على إنشاء صور تطابق جودة نماذج الرف العلوي بسعة 2 مليار معلمة. الأهم من ذلك ، تمكن هارت من تحقيق هذا المعلم بمعدل توليد صور أسرع تسع مرات ، بينما يتطلب موارد حسابية أقل بنسبة 31 ٪.

    وفقًا للفريق ، يتيح النهج المنخفض الحوسبة هارت أن يعمل محليًا على الهواتف وأجهزة الكمبيوتر المحمولة ، وهو فوز كبير. حتى الآن ، تتطلب منتجات السوق الجماعية الأكثر شعبية مثل ChatGPT و Gemini اتصال إنترنت لتوليد الصور مع حدوث الحوسبة في الخوادم السحابية.

    في مقطع الفيديو التجريبي ، عرض الفريق أنه يعمل أصلاً على جهاز كمبيوتر محمول من MSI مع معالج سلسلة Intel الأساسية وبطاقة رسومات NVIDIA Geforce RTX. هذا مزيج يمكنك العثور عليه في غالبية أجهزة الكمبيوتر المحمولة للألعاب هناك ، دون إنفاق ثروة ، أثناء وجوده في ذلك.

    Hart قادر على إنتاج صور نسبة العرض إلى ارتفاع 1: 1 بدقة محترمة 1024 × 1024 بكسل. مستوى التفاصيل في هذه الصور مثير للإعجاب ، وكذلك الاختلاف الأسلوبي ودقة المشهد. خلال اختباراتهم ، أشار الفريق إلى أن أداة AI الهجينة كانت في أي مكان بين ثلاث إلى ست مرات أسرع وعرضت أكثر من سبع مرات إنتاجية أعلى.

    الإمكانات المستقبلية مثيرة ، خاصة عند دمج إمكانيات صور هارت مع نماذج اللغة. يقول الفريق في معهد ماساتشوستس للتكنولوجيا: “في المستقبل ، يمكن للمرء أن يتفاعل مع نموذج توليدي موحد باللغة الرؤية ، ربما عن طريق مطالبة به إظهار الخطوات المتوسطة المطلوبة لتجميع قطعة من الأثاث”.

    إنهم يستكشفون هذه الفكرة بالفعل ، وحتى يخططون لاختبار نهج هارت في توليد الصوت والفيديو. يمكنك تجربتها على لوحة معلومات الويب الخاصة بـ MIT.

    بعض الحواف الخام

    قبل أن نغوص في نقاش الجودة ، ضع في اعتبارك أن هارت هو مشروع بحثي لا يزال في مراحله المبكرة. على الجانب الفني ، هناك بعض المتاعب التي أبرزها الفريق ، مثل النفقات العامة أثناء عملية الاستدلال والتدريب.

    يمكن إصلاح التحديات أو التغاضي عنها ، لأنها بسيطة في المخطط الأكبر للأشياء هنا. علاوة على ذلك ، بالنظر إلى الفوائد الهائلة التي يقدمها Hart من حيث كفاءة الحوسبة والسرعة والكمون ، فقد تستمر فقط دون أن تؤدي إلى أي مشاكل في الأداء الرئيسية.

    في الوقت القصير ، اختبرت هارت الاختبار ، لقد دهشت من وتيرة توليد الصور. بالكاد واجهت سيناريو حيث استغرقت أداة الويب المجانية أكثر من ثانيتين لإنشاء صورة. حتى مع طول المطالبات التي تمتد ثلاث فقرات (تقريبًا أكثر من 200 كلمة) ، تمكن هارت من إنشاء صور تلتزم بإحكام إلى الوصف.

    بصرف النظر عن الدقة الوصفية ، كان هناك الكثير من التفاصيل في الصور. ومع ذلك ، يعاني هارت من الإخفاقات النموذجية لأداة مولد صورة AI. إنه يكافح مع الأرقام ، والتصوير الأساسي مثل تناول المواد الغذائية ، واتساق الشخصية ، والفشل في التقاط المنظور.

    الواقعية في السياق البشري هي أحد المجالات التي لاحظت فيها إخفاقات صارخة. في مناسبات قليلة ، أصبح ببساطة مفهوم الكائنات الأساسية خاطئًا ، مثل الخلط بين الحلقة مع قلادة. لكن بشكل عام ، كانت هذه الأخطاء بعيدة ، قليلة ، ومن المتوقع بشكل أساسي. لا تزال مجموعة صحية من أدوات الذكاء الاصطناعى لا يمكنها الحصول على هذا بشكل صحيح ، على الرغم من وجودها هناك لفترة من الوقت الآن.

    بشكل عام ، أنا متحمس بشكل خاص للإمكانات الهائلة لهارت. سيكون من المثير للاهتمام معرفة ما إذا كان MIT و NVIDIA ينشئان منتجًا منه ، أو ببساطة اعتماد نهج توليد صور AI المختلط في منتج موجود. في كلتا الحالتين ، إنها لمحة عن مستقبل واعد للغاية.

    شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr البريد الإلكتروني
    السابقتم حظر Silent Hill F في أستراليا قبل الإصدار
    التالي وفر 72 ٪ على Top USA VPN + 2 أشهر مجانية

    المقالات ذات الصلة

    كمبيوتر

    أفضل أجهزة الكمبيوتر المحمولة من حيث عمر البطارية لعام 2025.

    9 ديسمبر, 2025
    كمبيوتر

    عرض آيباد بسعر 279 دولارًا لا يُفوت في موسم الأعياد.

    8 ديسمبر, 2025
    كمبيوتر

    جهاز GoPro Max 2 في مواجهة Insta360 X5: مقارنة كاميرات 360 درجة.

    8 ديسمبر, 2025
    كمبيوتر

    لا يزال عرض مجموعة “دي جي آي أوسمو بوكيت 3 كرييتور كومبو” (DJI Osmo Pocket 3 Creator Combo) ساريًا.

    8 ديسمبر, 2025
    كمبيوتر

    كيفية استخدام مُولِّد الفيديو “بولو إيه آي” (Pollo AI): دليل إرشادي.

    8 ديسمبر, 2025
    كمبيوتر

    أفضل عروض أجهزة الكمبيوتر المحمول: توفيرات بـمئات الدولارات على الأجهزة الجديدة في موسم العطلات.

    8 ديسمبر, 2025
    كمبيوتر

    يصل سعر شاشة سامسونج المنحنية فائقة الدقة 49 بوصة إلى 799.99 دولارًا، وتحل محل شاشتين.

    8 ديسمبر, 2025
    كمبيوتر

    لينوفو وديل تحذران من ارتفاع محتمل في أسعار أجهزة الكمبيوتر المحمولة.

    8 ديسمبر, 2025
    كمبيوتر

    روبوتات Unitree كبيرة الحجم تشبه البشر تخوض قتالاً (Unitree Robots Engage in Combat).

    7 ديسمبر, 2025
    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    Demo
    اخر الاخبار

    كيفية تسجيل مقاطع فيديو محمية بدون شاشة سوداء

    31 يوليو, 20241٬137 زيارة

    سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

    4 يوليو, 2024813 زيارة

    كل ما تريد معرفته عن Reacher الموسم الثالث

    6 مايو, 2024772 زيارة

    يحصل iPhone على أول تطبيق إباحي أصلي له

    4 فبراير, 2025745 زيارة

    Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

    2 أبريل, 2024718 زيارة

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    رائج الآن
    منوعات تقنية

    استخدم chatgpt بالعربي مجانا بدون تسجيل

    فريق التحرير29 مايو, 2025
    اخر الاخبار

    رجل مسؤول عن المنشآت العسكرية الساحلية يقول أن دود لا يهتم بتغير المناخ

    فريق التحرير11 فبراير, 2025
    ألعاب

    دليل كامل لتحميل “Red Dead Redemption Mobile” على نتفليكس الشهر المقبل.

    فريق التحرير22 نوفمبر, 2025
    رائج الآن

    استخدم chatgpt بالعربي مجانا بدون تسجيل

    29 مايو, 202524 زيارة

    رجل مسؤول عن المنشآت العسكرية الساحلية يقول أن دود لا يهتم بتغير المناخ

    11 فبراير, 202514 زيارة

    دليل كامل لتحميل “Red Dead Redemption Mobile” على نتفليكس الشهر المقبل.

    22 نوفمبر, 202512 زيارة
    اختيارات المحرر

    تقرير: كابكوم تعتزم إحياء سلسلتي “ميجا مان” و”ديفل ماي كراي” وتُهمل “داينو كرايسس”.

    9 ديسمبر, 2025

    ترامب يزعم أن نفيديا تستطيع بيع شريحة H200 للصين.

    9 ديسمبر, 2025

    “جائزة الابتكار العالمية في المياه” تتوج أفضل 14 حلًا مبتكرًا لمواجهة ندرة المياه وتغير المناخ

    9 ديسمبر, 2025

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    تقنية نيوز
    فيسبوك X (Twitter) الانستغرام يوتيوب لينكدإن تيكتوك
    • الرئيسية
    • سياسة الخصوصية
    • من نحن
    • اتصل بنا
    © 2025 تقنية نيوز. جميع حقوق النشر محفوظة.

    اكتب كلمة البحث ثم اضغط على زر Enter