Close Menu
تقنية نيوزتقنية نيوز
    مقالات قد تهمك

    هذا Lenovo Ideapad 15.6 “512 جيجابايت هو 549 دولار فقط ، بانخفاض من 1849 دولار على Amazon (70 ٪ خصم)

    20 مايو, 2025

    هل تحتاج إلى جهاز كمبيوتر محمول Copilot+؟ Dell XPS 13 هو 400 دولار قبالة الآن

    20 مايو, 2025

    تقسيم لوحة مفاتيح ألعاب ASUS هذه للراحة

    20 مايو, 2025
    فيسبوك X (Twitter) الانستغرام
    • من نحن
    • سياسة الخصوصية
    • اتصل بنا
    فيسبوك X (Twitter) الانستغرام يوتيوب
    تقنية نيوزتقنية نيوز
    • الرئيسية
    • اخر الاخبار
    • هواتف ذكية
    • كمبيوتر
    • برامج وتطبيقات
    • شركات
      • ابل
      • سامسونج
      • جوجل
      • مايكروسوفت
      • أمازون
    • المزيد
      • الذكاء الإصطناعي
      • الأمن الإلكتروني
      • ألعاب
      • منوعات تقنية
    اشترك معنا
    تقنية نيوزتقنية نيوز
    الرئيسية » يعرض Meta Fair AI الذي يشبه الإنسان مع خمسة إصدارات رئيسية
    الذكاء الإصطناعي

    يعرض Meta Fair AI الذي يشبه الإنسان مع خمسة إصدارات رئيسية

    فريق التحريربواسطة فريق التحرير17 أبريل, 20250 زيارةلا توجد تعليقات
    شاركها فيسبوك تويتر بينتيريست لينكدإن Tumblr رديت تيلقرام البريد الإلكتروني
    شاركها
    فيسبوك تويتر لينكدإن بينتيريست البريد الإلكتروني

    أعلن فريق أبحاث الذكاء الاصطناعى الأساسي (FAIR) في META عن خمس مشاريع تقدم سعي الشركة إلى ذكاء الآلات المتقدمة (AMI).

    تركز أحدث الإصدارات من Meta بشكل كبير على تعزيز إدراك الذكاء الاصطناعي – قدرة الآلات على معالجة وتفسير المعلومات الحسية – إلى جانب التطورات في نمذجة اللغة والروبوتات ووكلاء الذكاء الاصطناعي التعاوني.

    ذكرت Meta أن هدفها ينطوي على إنشاء آلات “قادرة على الحصول على المعلومات الحسية ومعالجتها وتفسيرها حول العالم من حولنا ، ويمكنهم استخدام هذه المعلومات لاتخاذ القرارات مع الذكاء والسرعة الشبيهة بالإنسان.”

    تمثل الإصدارات الخمسة الجديدة الجهود المتنوعة ولكن المترابطة نحو تحقيق هذا الهدف الطموح.

    تشفير الإدراك: meta يشحذ “رؤية” الذكاء الاصطناعي

    من الأمور الأساسية للإصدارات الجديدة هو تشفير الإدراك ، الموصوف بأنه تشفير رؤية واسع النطاق مصمم للتفوق عبر مختلف مهام الصور والفيديو.

    تعمل مشفرات الرؤية كـ “عيون” لأنظمة الذكاء الاصطناعى ، مما يسمح لها بفهم البيانات البصرية.

    يسلط Meta الضوء على التحدي المتزايد المتمثل في بناء المشفرات التي تلبي متطلبات الذكاء الاصطناعى المتقدم ، والتي تتطلب إمكانات التي تعالج الرؤية واللغة ، والتعامل مع كل من الصور ومقاطع الفيديو بشكل فعال ، وتظل قوية في ظل ظروف صعبة ، بما في ذلك الهجمات العدائية المحتملة.

    يجب أن يتعرف المشفر المثالي ، وفقًا لـ META ، على مجموعة واسعة من المفاهيم مع التمييز بين التفاصيل الدقيقة – مما يضع أمثلة مثل اكتشاف “stingray lurrowed تحت قاع البحر ، مع تحديد غولفنش صغير في خلفية صورة ما ، أو اصطياد agouti المتجول على كاميرا للحياة البرية في الرؤية الليلية.”

    تدعي Meta أن تشفير التصور يحقق “أداءً استثنائياً على تصنيف الصور والفيديو صفراً وتراجعًا ، متجاوزًا جميع النماذج الموجودة في المصادر المفتوحة والملكية لمثل هذه المهام.”

    علاوة على ذلك ، يقال إن نقاط قوته الإدراكية تترجم جيدًا إلى مهام اللغة.

    عند التوافق مع نموذج لغة كبير (LLM) ، يقال إن المشفر يتفوق على ترميزات الرؤية الأخرى في مجالات مثل الإجابة على أسئلة مرئية (VQA) ، والتسمية التوضيحية ، وفهم الوثائق ، والتأريض (ربط النص بمناطق صورة محددة). وبحسب ما ورد ، يعزز الأداء في المهام صعبة التقليدية بالنسبة لـ LLMs ، مثل فهم العلاقات المكانية (على سبيل المثال ، “إذا كان هناك كائن وراء آخر”) أو حركة الكاميرا بالنسبة إلى كائن.

    وقال ميتا: “مع بدء التصور في التصور في تطبيقات جديدة ، نحن متحمسون لمعرفة كيف ستمكن قدرات الرؤية المتقدمة أنظمة الذكاء الاصطناعى أكثر قدرة”.

    نموذج لغة الإدراك (PLM): البحث المفتوح في لغة الرؤية

    استكمال المشفر هو نموذج لغة الإدراك (PLM) ، وهو نموذج مفتوح وقابل للاستنساخ اللغوي الذي يهدف إلى مهام التعرف المرئي المعقدة.

    تم تدريب PLM باستخدام بيانات اصطناعية واسعة النطاق مع مجموعات بيانات ذات لغة مفتوحة ، بشكل صريح دون تقطير المعرفة من نماذج الملكية الخارجية.

    من خلال التعرف على الثغرات في بيانات فهم الفيديو الحالية ، جمع الفريق العادل 2.5 مليون عينة جديدة ذات علامة الإنسان التي تركز على إجابة أسئلة الفيديو الدقيقة والتعليق المكاني والزماني. تدعي Meta أن هذا يشكل “أكبر مجموعة بيانات من نوعها حتى الآن.”

    يتم تقديم PLM في إصدارات المعلمة 1 و 3 و 8 مليارات ، تلبية احتياجات البحث الأكاديمي التي تتطلب الشفافية.

    إلى جانب النماذج ، تقوم Meta بإصدار PLM-VideObench ، وهو معيار جديد مصمم خصيصًا لاختبار القدرات غالبًا ما يفتقده المعايير الحالية ، أي “فهم النشاط الدقيق والمنطق المكاني على الأرض”.

    يأمل Meta في أن يمكّن مزيج من النماذج المفتوحة ، ومجموعة البيانات الكبيرة ، والمعيار الصعبة للمجتمع المفتوح المصدر.

    تحديد موقع Meta 3D: إعطاء روبوتات الوعي الظرفي

    سد الفجوة بين أوامر اللغة والعمل البدني هو تحديد موقع Meta 3D. يهدف هذا النموذج الشامل إلى السماح للروبوتات بتوطين الأشياء بدقة في بيئة ثلاثية الأبعاد تعتمد على استعلامات اللغة الطبيعية المفتوحة.

    Meta تحديد موقع 3D العمليات السحب ثلاثية الأبعاد مباشرة من أجهزة استشعار RGB-D (مثل تلك الموجودة على بعض الروبوتات أو كاميرات الاستشعار عن العمق). بالنظر إلى موجه نصي ، مثل “مزهرية الزهور بالقرب من وحدة التحكم التلفزيونية” ، ينظر النظام في العلاقات المكانية والسياق لتحديد مثيل الكائن الصحيح ، ويميزه ، على سبيل المثال ، “مزهرية على الطاولة”.

    يشتمل النظام على ثلاثة أجزاء رئيسية: خطوة معالجة مسبقة تحويل ميزات ثنائية الأبعاد إلى غيوم النقطة ثلاثية الأبعاد ؛ تشفير jepa ثلاثي الأبعاد (نموذج قبل أن يخلق تمثيلًا ثلاثي الأبعاد للسياق ثلاثية الأبعاد) ؛ وموقع فك التشفير ثلاثي الأبعاد ، الذي يأخذ التمثيل ثلاثي الأبعاد والاستعلام اللغوي لإخراج الصناديق والأقنعة حول الكائنات المحددة.

    إلى جانب النموذج ، تقوم Meta بإصدار مجموعة بيانات جديدة كبيرة لتوطين الكائنات بناءً على تعبيرات إحالة. ويشمل 130،000 تعليقات اللغة عبر 1،346 مشاهد من مجموعات بيانات Arkitscenes و Scannet و Scannet ++ ، مما يضاعف بشكل فعال بيانات مشروحة موجودة في هذا المجال.

    ترى Meta أن هذه التكنولوجيا أمر بالغ الأهمية لتطوير أنظمة آلية أكثر قدرة ، بما في ذلك مشروع Partnr Robot الخاص بها ، مما يتيح المزيد من التفاعل والتعاون الطبيعي البشري.

    محول كامن بايت ديناميكي: نمذجة لغة فعالة وقوية

    بعد الأبحاث المنشورة في أواخر عام 2024 ، تصدر Meta الآن أوزان النموذج لمحولها الكامن البايت الديناميكي البالغ 8 مليارات.

    تمثل هذه البنية تحولًا بعيدًا عن نماذج اللغة التقليدية القائمة على الرمز المميز ، وتعمل بدلاً من ذلك على مستوى البايت. تدعي Meta أن هذا النهج يحقق أداءً مماثلًا على نطاق واسع مع تقديم تحسينات كبيرة في كفاءة الاستدلال والمتانة.

    تقسم LLMs التقليدية النص إلى “الرموز” ، والتي يمكن أن تصارع مع الأخطاء الإملائية ، والكلمات الجديدة ، أو المدخلات العدائية. النماذج على مستوى البايت معالجة البايتات الخام ، وربما توفر مرونة أكبر.

    تشير Meta إلى أن المحول الديناميكي Byte Latent Transformer “يتفوق على النماذج القائمة على الرمز المميز عبر مختلف المهام ، مع ميزة متانة متوسط ​​قدرها +7 نقاط (على Hellaswag المضطربة) ، والوصول إلى ما يصل إلى +55 نقطة في المهام من معايير الرمز المميز اللطيف.”

    من خلال إطلاق الأوزان إلى جانب قاعدة الشفرة المشتركة سابقًا ، تشجع Meta مجتمع الأبحاث على استكشاف هذا النهج البديل لنمذجة اللغة.

    سبب تعاوني: Meta يتقدم

    يعالج الإصدار النهائي ، وهو Distresser التعاوني ، التحدي المعقد المتمثل في إنشاء وكلاء الذكاء الاصطناعى الذين يمكنهم التعاون بفعالية مع البشر أو غيرها من الذكاء الاصطناعي.

    يلاحظ Meta أن التعاون البشري غالبًا ما يعطي نتائج متفوقة ، ويهدف إلى إشراك الذكاء الاصطناعي مع إمكانات مماثلة للمهام مثل المساعدة في الواجب المنزلي أو إعداد المقابلة الوظيفية.

    لا يتطلب هذا التعاون حل المشكلات فحسب ، بل يتطلب أيضًا مهارات اجتماعية مثل التواصل والتعاطف وتوفير التعليقات وفهم الحالات العقلية للآخرين (نظرية القول) ، وغالبًا ما تتكشف عن المنعطفات المحادثة المتعددة.

    غالبًا ما تهمل أساليب التدريب والتقييم الحالية LLM هذه الجوانب الاجتماعية والتعاونية. علاوة على ذلك ، فإن جمع بيانات المحادثة ذات الصلة مكلفة وصعبة.

    يوفر Distresser التعاونية إطارًا لتقييم هذه المهارات وتعزيزها. ويشمل المهام الموجهة نحو الأهداف التي تتطلب التفكير متعدد الخطوات الذي تم تحقيقه من خلال المحادثة بين وكيلين. يختبر الإطار قدرات مثل الاختلاف بشكل بناء ، وإقناع الشريك ، والوصول إلى حل أفضل مشترك.

    كشفت تقييمات Meta أن النماذج الحالية تكافح للاستفادة باستمرار من التعاون للحصول على نتائج أفضل. لمعالجة هذا ، يقترحون تقنية تحسين الذات باستخدام بيانات التفاعل الاصطناعي حيث يتعاون وكيل LLM مع نفسه.

    يتم تمكين إنشاء هذه البيانات على نطاق واسع من خلال محرك خدمة طراز عالي الأداء جديد يسمى Matrix. باستخدام هذا النهج في الرياضيات ، أفادت التقارير أن مهام التفكير العلمي والاجتماعي أسفرت عن تحسينات تصل إلى 29.4 ٪ مقارنة بأداء “سلسلة الفكرة” القياسي لـ LLM واحد.

    من خلال التعهيد المفتوح لتوليد البيانات ونمذجة النمذجة ، تهدف Meta إلى تعزيز المزيد من الأبحاث إلى إنشاء “وكلاء اجتماعيين يمكنهم الشراكة مع البشر والوكلاء الآخرين”.

    هذه الإصدارات الخمسة التي تؤكد بشكل جماعي استمرار الاستثمار الثقيل في Meta في أبحاث الذكاء الاصطناعي الأساسي ، مع التركيز بشكل خاص على لبنات بناء الآلات التي يمكن أن تتصور وفهم وتفاعل مع العالم بطرق أكثر تشبه الإنسان.

    انظر أيضا: سيقوم Meta بتدريب نماذج الذكاء الاصطناعي باستخدام بيانات مستخدم الاتحاد الأوروبي

    هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الكبيرة من قادة الصناعة؟ تحقق من AI و Big Data Expo الذي يقام في أمستردام ، كاليفورنيا ، ولندن. تم تحديد الحدث الشامل مع الأحداث الرائدة الأخرى بما في ذلك مؤتمر الأتمتة الذكي ، و blockx ، وأسبوع التحول الرقمي ، ومعرض Cyber ​​Security & Cloud.

    استكشاف أحداث وندوات الويب القادمة الأخرى التي تعمل بها TechForge هنا.

    شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr البريد الإلكتروني
    السابقموقع سيئ السمعة 4chan الذي أسقطه أحد المتسللين من مجتمع منافس
    التالي ستحطم موسم المعادن الملتوية في نهاية يوليو

    المقالات ذات الصلة

    الذكاء الإصطناعي

    AI يحول التنبؤ أسعار البيتكوين واستراتيجية السوق

    19 مايو, 2025
    الذكاء الإصطناعي

    الذكاء الاصطناعي في ذكاء الأعمال: تحذير emptor

    16 مايو, 2025
    الذكاء الإصطناعي

    لماذا تقوم Microsoft بتخفيض الأدوار على الرغم من الأرباح القوية

    16 مايو, 2025
    الذكاء الإصطناعي

    الكونغرس يدفع تتبع نظام تحديد المواقع العالمي (GPS) لكل أشباه الموصلات المصدرة

    16 مايو, 2025
    الذكاء الإصطناعي

    هل يمكن للولايات المتحدة حقًا فرض حظر رقاقة من الذكاء الاصطناعي العالمي؟

    16 مايو, 2025
    الذكاء الإصطناعي

    أداة الذكاء الاصطناعى تسرع ردود الفعل الحكومية ، ويحث الخبراء الحذر

    15 مايو, 2025
    الذكاء الإصطناعي

    أداة فيديو AI مفتوحة المصدر للجميع

    15 مايو, 2025
    الذكاء الإصطناعي

    الابتكار مقابل الرقابة في تنظيم المخدرات

    14 مايو, 2025
    الذكاء الإصطناعي

    تنتقل المملكة العربية السعودية لبناء مستقبل الذكاء الاصطناعي مع همان و Nvidia

    14 مايو, 2025
    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    Demo
    اخر الاخبار

    كيفية تسجيل مقاطع فيديو محمية بدون شاشة سوداء

    31 يوليو, 2024853 زيارة

    سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

    4 يوليو, 2024693 زيارة

    كل ما تريد معرفته عن Reacher الموسم الثالث

    6 مايو, 2024672 زيارة

    Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

    2 أبريل, 2024646 زيارة

    4 مزايا بطاريات السيليكون الكربونية للهواتف الذكية

    7 مارس, 2024485 زيارة
    رائج الآن
    اخر الاخبار

    كيفية تسجيل مقاطع فيديو محمية بدون شاشة سوداء

    فريق التحرير31 يوليو, 2024
    اخر الاخبار

    يحصل iPhone على أول تطبيق إباحي أصلي له

    فريق التحرير4 فبراير, 2025

    أفضل منصات التداول التنافسي: دليلك لاختيار الأفضل في 2025

    محمد محمود11 مايو, 2025
    رائج الآن

    كيفية تسجيل مقاطع فيديو محمية بدون شاشة سوداء

    31 يوليو, 202420 زيارة

    يحصل iPhone على أول تطبيق إباحي أصلي له

    4 فبراير, 202519 زيارة

    أفضل منصات التداول التنافسي: دليلك لاختيار الأفضل في 2025

    11 مايو, 202517 زيارة
    اختيارات المحرر

    هذا Lenovo Ideapad 15.6 “512 جيجابايت هو 549 دولار فقط ، بانخفاض من 1849 دولار على Amazon (70 ٪ خصم)

    20 مايو, 2025

    هل تحتاج إلى جهاز كمبيوتر محمول Copilot+؟ Dell XPS 13 هو 400 دولار قبالة الآن

    20 مايو, 2025

    تقسيم لوحة مفاتيح ألعاب ASUS هذه للراحة

    20 مايو, 2025
    تقنية نيوز
    فيسبوك X (Twitter) الانستغرام يوتيوب لينكدإن تيكتوك
    • الرئيسية
    • سياسة الخصوصية
    • من نحن
    • اتصل بنا
    © 2025 تقنية نيوز. جميع حقوق النشر محفوظة.

    اكتب كلمة البحث ثم اضغط على زر Enter