تطلق Hugging Face نموذج لغة الرؤية Idefics2

أعلنت شركة Hugging Face عن إطلاق Idefics2، وهو نموذج متعدد الاستخدامات قادر على فهم وإنشاء استجابات نصية بناءً على الصور والنصوص. يضع النموذج معيارًا جديدًا للإجابة على الأسئلة المرئية، ووصف المحتوى المرئي، وإنشاء القصة من الصور، واستخراج معلومات المستند، وحتى إجراء العمليات الحسابية بناءً على المدخلات المرئية.

يتفوق Idefics2 على سابقه، Idefics1، بثمانية مليارات معلمة فقط وتعدد الاستخدامات الذي يوفره ترخيصه المفتوح (Apache 2.0)، إلى جانب قدرات التعرف البصري على الأحرف (OCR) المحسنة بشكل ملحوظ.

لا يعرض النموذج أداءً استثنائيًا في معايير الإجابة على الأسئلة المرئية فحسب، بل يحافظ أيضًا على مكانته في مواجهة معاصرين أكبر بكثير مثل LLava-Next-34B وMM1-30B-chat:

من أهم عوامل جاذبية Idefics2 هو تكاملها مع Hugging Face's Transformers منذ البداية، مما يضمن سهولة الضبط الدقيق لمجموعة واسعة من التطبيقات متعددة الوسائط. بالنسبة لأولئك الذين يتوقون للتعمق، تتوفر النماذج للتجربة على Hugging Face Hub.

إحدى الميزات البارزة في Idefics2 هي فلسفتها التدريبية الشاملة، التي تمزج مجموعات البيانات المتاحة بشكل مفتوح بما في ذلك مستندات الويب وأزواج التسميات التوضيحية للصور وبيانات التعرف الضوئي على الحروف. علاوة على ذلك، فهو يقدم مجموعة بيانات مبتكرة ومُحسَّنة يُطلق عليها اسم “The Cauldron”، والتي تدمج 50 مجموعة بيانات منسقة بدقة للتدريب على المحادثة متعدد الأوجه.

يعرض Idefics2 نهجًا محسنًا لمعالجة الصور، مع الحفاظ على الدقة الأصلية ونسب العرض إلى الارتفاع – وهو انحراف ملحوظ عن معايير تغيير الحجم التقليدية في رؤية الكمبيوتر. وتستفيد هندسته بشكل كبير من إمكانيات التعرف الضوئي على الحروف المتقدمة، حيث يقوم بنسخ المحتوى النصي داخل الصور والمستندات ببراعة، ويفتخر بأداء محسن في تفسير المخططات والأشكال.

يمثل تبسيط دمج الميزات المرئية في العمود الفقري للغة تحولًا عن بنية سابقتها، مع اعتماد تجميع المتلقي المتعلم وإسقاط طريقة MLP مما يعزز فعالية Idefics2 الشاملة.

يفتح هذا التقدم في نماذج لغة الرؤية آفاقًا جديدة لاستكشاف التفاعلات متعددة الوسائط، مع استعداد Idefics2 ليكون بمثابة أداة تأسيسية للمجتمع. تؤكد تحسينات الأداء والابتكارات التقنية على إمكانية الجمع بين البيانات المرئية والنصية في إنشاء أنظمة ذكاء اصطناعي متطورة ومدركة للسياق.

بالنسبة للمتحمسين والباحثين الذين يتطلعون إلى الاستفادة من قدرات Idefics2، يوفر Hugging Face ضبطًا تفصيليًا دقيقًا درس تعليمي.

أنظر أيضا: OpenAI يجعل GPT-4 Turbo مع Vision API متاحًا بشكل عام

هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الضخمة من قادة الصناعة؟ اطلع على معرض الذكاء الاصطناعي والبيانات الضخمة الذي يقام في أمستردام وكاليفورنيا ولندن. ويقام هذا الحدث الشامل في مكان مشترك مع الأحداث الرائدة الأخرى بما في ذلك BlockX، وأسبوع التحول الرقمي، ومعرض الأمن السيبراني والسحابي.

استكشف الأحداث والندوات عبر الإنترنت القادمة الأخرى المتعلقة بتكنولوجيا المؤسسات والمدعومة من TechForge هنا.

العلامات: الذكاء الاصطناعي، الذكاء الاصطناعي، المعيار، وجه معانق، IDEFICS 2، IDEFICS2، النموذج، لغة الرؤية

مقالات قد تهمك

لن تسمح لك هذه البرامج الضارة الجديدة لنظام Mac باستخدام جهاز الكمبيوتر الخاص بك حتى تقوم بتسليم كلمة المرور الخاصة بك

كيف تختار باور بانك عالي السعة في 2026: السعة، القدرة الفعلية، وماذا تعني الأرقام على العلبة

قراءة في تسارع أحداث مسلسل “حب ع ورق” الحلقة 28 عبر موقع برستيج

العمل الحر في عصر الذكاء الاصطناعي 2026: مهارات لازم تتعلمها الآن

تحويل النص إلى فيديو بالذكاء الاصطناعي: أفضل مواقع 2026

ثورة وكلاء الذكاء الاصطناعي (AI Agents) :هل سيستبدلون الموظفين في 2026؟

أفضل أفكار مشاريع رقمية مربحة في 2026 بدون رأس مال كبير

الذكاء الاصطناعي في التسويق الإلكتروني: استراتيجيات تحقق أرباح خيالية

أفضل مواقع الربح من الإنترنت بدون رأس مال 2026 (دليل علمي مجرب)

أقوى ترندات التكنولوجيا في 2026: ماذا ينتظر العالم الرقمي؟

كيف تربح من ChatGPT في عام 2026: طرق عملية للمبتدئين والمحترفين

أفضل أدوات الذكاء الاصطناعي 2026: كيف تضاعف إنتاجيتك في دقائق؟

مقارنة بين Samsung Galaxy Z Fold 6 و Galaxy S24 Ultra: لا تخطئ

يحصل iPhone على أول تطبيق إباحي أصلي له

سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

كل ما تريد معرفته عن Reacher الموسم الثالث

Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

قائمة أكواد Roblox المجانية وكيفية استخدامها: لا تفوت الفرصة!

رسمياً: يمكنك لعب GTA Online مجانًا الآن على جميع المنصات المنزلية

كيف تختار باور بانك عالي السعة في 2026: السعة، القدرة الفعلية، وماذا تعني الأرقام على العلبة

رائج الآن

قائمة أكواد Roblox المجانية وكيفية استخدامها: لا تفوت الفرصة!

رسمياً: يمكنك لعب GTA Online مجانًا الآن على جميع المنصات المنزلية

كيف تختار باور بانك عالي السعة في 2026: السعة، القدرة الفعلية، وماذا تعني الأرقام على العلبة

اختيارات المحرر

لن تسمح لك هذه البرامج الضارة الجديدة لنظام Mac باستخدام جهاز الكمبيوتر الخاص بك حتى تقوم بتسليم كلمة المرور الخاصة بك

كيف تختار باور بانك عالي السعة في 2026: السعة، القدرة الفعلية، وماذا تعني الأرقام على العلبة

قراءة في تسارع أحداث مسلسل “حب ع ورق” الحلقة 28 عبر موقع برستيج

خدمة الإشعارات البريدية

مقالات قد تهمك

تطلق Hugging Face نموذج لغة الرؤية Idefics2

المقالات ذات الصلة

خدمة الإشعارات البريدية