Close Menu
تقنية نيوزتقنية نيوز
    مقالات قد تهمك

    يريد Openai الحصول على أطفال جامعيين على الذكاء الاصطناعي

    8 يونيو, 2025

    تسريب يكشف خطط سوني السرية حول جهاز بلايستيشن المحمول

    8 يونيو, 2025

    من المتوقع أن يكون موضوع الخطوات الأولى ممتازة

    7 يونيو, 2025
    فيسبوك X (Twitter) الانستغرام
    • من نحن
    • سياسة الخصوصية
    • اتصل بنا
    فيسبوك X (Twitter) الانستغرام يوتيوب
    تقنية نيوزتقنية نيوز
    • الرئيسية
    • اخر الاخبار
    • هواتف ذكية
    • كمبيوتر
    • برامج وتطبيقات
    • شركات
      • ابل
      • سامسونج
      • جوجل
      • مايكروسوفت
      • أمازون
    • المزيد
      • الذكاء الإصطناعي
      • الأمن الإلكتروني
      • ألعاب
      • منوعات تقنية
    اشترك معنا
    تقنية نيوزتقنية نيوز
    الرئيسية » Deep Cogito Open LLMS استخدم IDA لتفوق نماذج الحجم نفسها
    الذكاء الإصطناعي

    Deep Cogito Open LLMS استخدم IDA لتفوق نماذج الحجم نفسها

    فريق التحريربواسطة فريق التحرير9 أبريل, 20250 زيارةلا توجد تعليقات
    شاركها فيسبوك تويتر بينتيريست لينكدإن Tumblr رديت تيلقرام البريد الإلكتروني
    شاركها
    فيسبوك تويتر لينكدإن بينتيريست البريد الإلكتروني

    أصدرت Deep Cogito العديد من نماذج اللغة الكبيرة المفتوحة (LLMS) التي تتفوق على المنافسين ويدعي أنها تمثل خطوة نحو تحقيق الإلغاء العام.

    أطلقت الشركة التي تتخذ من سان فرانسيسكو مقراً لها ، والتي تنص على أن “بناء سوبرايتينس العام” ، أطلقت إصدارات معاينة من LLMS بأحجام المعلمات 3B و 8B و 14B و 32B و 70B. يؤكد Deep Cogito أن “كل نموذج يتفوق على أفضل النماذج المفتوحة المتاحة من نفس الحجم ، بما في ذلك نظيراتها من LAMA و DEEPSEEK و QWEN ، عبر معظم المعايير القياسية”.

    بشكل مثير للإعجاب ، فإن طراز 70B من Deep Cogito يتجاوز أداء نموذج Llama 4 109B Mixperts (MOE) الذي تم إصداره مؤخرًا.

    التقطير المكرر والتضخيم (IDA)

    المركزية في هذا الإصدار هي منهجية تدريب جديدة تسمى التقطير المتكرر والتضخيم (IDA).

    يصف Deep Cogito IDA بأنه “استراتيجية محاذاة قابلة للتطوير وفعالة للألواح العامة باستخدام التحسين الذاتي التكراري”. تهدف هذه التقنية إلى التغلب على القيود المتأصلة في نماذج تدريب LLM الحالية ، حيث غالبًا ما يتم تخصيص ذكاء النموذج من خلال قدرات نماذج “المشرف” الأكبر أو القيمين البشريين.

    تتضمن عملية IDA خطوتين رئيسيتين تكررت مرارًا وتكرارًا:

    • التضخيم: استخدام المزيد من الحساب لتمكين النموذج من استخلاص حلول أو قدرات أفضل ، على غرار تقنيات التفكير المتقدمة.
    • التقطير: استيعاب هذه القدرات المتضخمة مرة أخرى في معلمات النموذج.

    يقول Deep Cogito إن هذا يخلق “حلقة ردود فعل إيجابية” حيث يتجه موارد الذكاء النموذجية بشكل مباشر مع الموارد الحسابية وكفاءة عملية IDA ، بدلاً من أن تكون محدودة بدقة من قبل الذكاء المشرف.

    “عندما ندرس أنظمة superintligent ،” تلاحظ البحث ، تشير إلى نجاحات مثل Alphago ، “نجد مكونين رئيسيين مكّن هذا الاختراق: التفكير المتقدم والتحسين الذاتي التكراري”. يتم تقديم IDA كوسيلة لدمج كل من تدريب LLM.

    تدعي Deep Cogito أن IDA فعال ، حيث ذكر تم تطوير النماذج الجديدة من قبل فريق صغير في حوالي 75 يومًا. كما أنها تسلط الضوء على قابلية التوسع المحتملة لـ IDA مقارنة بطرق مثل التعلم التعزيز من التعليقات البشرية (RLHF) أو التقطير القياسي من نماذج أكبر.

    كدليل ، تشير الشركة إلى نموذجها 70B الذي يتفوق على LAMA 3.3 70B (المقطر من نموذج 405B) و LLAMA 4 SCOUT 109B (المقطر من نموذج المعلمة 2T).

    قدرات وأداء نماذج كوجيتو العميقة

    يتم تحسين نماذج Cogito التي تم إصدارها حديثًا – استنادًا إلى نقاط التفتيش LAMA و QWEN – للترميز ، ومكالمات الوظائف ، وحالات الاستخدام الوظيفي.

    الميزة الرئيسية هي وظيفتها المزدوجة: “يمكن لكل نموذج الإجابة مباشرة (LLM القياسية) ، أو الانعكاس الذاتي قبل الرد (مثل نماذج التفكير)” ، على غرار القدرات التي شوهدت في نماذج مثل Claude 3.5. ومع ذلك ، يلاحظ Deep Cogito أنها “لم يتم تحسينها لسلاسل التفكير الطويلة جدًا” ، مشيرين إلى تفضيل المستخدم للحصول على إجابات أسرع وكفاءة تقطير السلاسل الأقصر.

    يتم توفير نتائج قياسية واسعة ، مقارنة نماذج Cogito مع النماذج المفتوحة المتخصصة في الحجم في كل من أوضاع الاستدلال المباشرة (القياسية).

    عبر مختلف المعايير (MMLU ، MMLU-PRO ، ARC ، GSM8K ، MATH ، إلخ) وأحجام النماذج (3B ، 8B ، 14B ، 32B ، 70B ،) تظهر نماذج Cogito مكاسب مهمة بشكل عام على نظيرات مثل Llama 3.1/3.2/3.3 و Qwen 2.5 ، وخاصة في وضع المنطق.

    على سبيل المثال ، يحقق طراز Cogito 70B 91.73 ٪ على MMLU في الوضع القياسي (+6.40 ٪ مقابل Llama 3.3 70B) و 91.00 ٪ في وضع التفكير (+4.40 ٪ مقابل Deepseek R1 Distill 70b). عشرات LiveBench تظهر أيضا تحسينات.

    فيما يلي معايير نماذج 14B لمقارنة متوسطة الحجم:

    في حين أن الاعتراف بالمعايير لا يحصل على فائدة في العالم الحقيقي ، فإن Deep Cogito تعبر عن ثقتها في الأداء العملي.

    تم تصنيف هذا الإصدار على أنه معاينة ، حيث ذكرت Cogito العميق أنها “لا تزال في المراحل المبكرة من منحنى التحجيم هذا. يخططون لإطلاق نقاط التفتيش المحسنة للأحجام الحالية وإدخال نماذج MOE أكبر (109B ، 400B ، 671B) “في الأسابيع / الشهور المقبلة”. جميع النماذج المستقبلية ستكون أيضًا مفتوحة المصدر.

    (تصوير بيترو ماتيا)

    انظر أيضا: يستهدف Alibaba Cloud نمو AI العالمي مع نماذج وأدوات جديدة

    هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الكبيرة من قادة الصناعة؟ تحقق من AI و Big Data Expo الذي يقام في أمستردام ، كاليفورنيا ، ولندن. تم تحديد الحدث الشامل مع الأحداث الرائدة الأخرى بما في ذلك مؤتمر الأتمتة الذكي ، و blockx ، وأسبوع التحول الرقمي ، ومعرض Cyber ​​Security & Cloud.

    استكشاف أحداث وندوات الويب القادمة الأخرى التي تعمل بها TechForge هنا.

    شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr البريد الإلكتروني
    السابقتخلص من إعلانات YouTube لجميع أفراد الأسرة – خطة Lifetime Adguard الآن 15.97 دولار
    التالي الفحص ثلاثي الأبعاد من حطام تيتانيك يكتشف التضحيات البطولية خلال لحظات السفينة الأخيرة

    المقالات ذات الصلة

    الذكاء الإصطناعي

    يطلق الأنثروبور نماذج كلود AI للأمن القومي الأمريكي

    6 يونيو, 2025
    الذكاء الإصطناعي

    Reddit يقاضي الأنثروبور على تجريف بيانات الذكاء الاصطناعي

    5 يونيو, 2025
    الذكاء الإصطناعي

    منظمة العفو الدولية تنشر الأمن والحوكمة ، مع Deloitte

    4 يونيو, 2025
    الذكاء الإصطناعي

    منظمة العفو الدولية تتيح التحول من التمكين إلى القيادة الاستراتيجية

    4 يونيو, 2025
    الذكاء الإصطناعي

    يعلم MIT Spinout منظمة العفو الدولية أن تعترف عندما يكون الأمر جاهلًا

    3 يونيو, 2025
    الذكاء الإصطناعي

    يستخدم IBM و Roche منظمة العفو الدولية للتنبؤ بمستويات السكر في الدم

    2 يونيو, 2025
    الذكاء الإصطناعي

    أحدث طراز من الذكاء الاصطناعي لـ Deepseek A “خطوة كبيرة إلى الوراء” لحرية التعبير

    30 مايو, 2025
    الذكاء الإصطناعي

    نموذج AI من Odyssey يحول الفيديو إلى عوالم تفاعلية

    29 مايو, 2025
    الذكاء الإصطناعي

    Huawei Supernode 384 يعطل سوق Nvidia's AI Market

    28 مايو, 2025
    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    Demo
    اخر الاخبار

    كيفية تسجيل مقاطع فيديو محمية بدون شاشة سوداء

    31 يوليو, 2024876 زيارة

    سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

    4 يوليو, 2024694 زيارة

    كل ما تريد معرفته عن Reacher الموسم الثالث

    6 مايو, 2024677 زيارة

    Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

    2 أبريل, 2024646 زيارة

    4 مزايا بطاريات السيليكون الكربونية للهواتف الذكية

    7 مارس, 2024485 زيارة
    رائج الآن
    اخر الاخبار

    يحصل iPhone على أول تطبيق إباحي أصلي له

    فريق التحرير4 فبراير, 2025
    اخر الاخبار

    هل يستمع هاتفك سراً؟ إليك طريقة بسيطة لمعرفة ذلك

    فريق التحرير13 أبريل, 2025
    اخر الاخبار

    أستخدم هذا المربع المكون من 18 دولارًا لتوصيل جميع أجهزتي الذكية في الهواء الطلق بأمان

    فريق التحرير6 يونيو, 2025
    رائج الآن

    يحصل iPhone على أول تطبيق إباحي أصلي له

    4 فبراير, 202517 زيارة

    هل يستمع هاتفك سراً؟ إليك طريقة بسيطة لمعرفة ذلك

    13 أبريل, 20256 زيارة

    أستخدم هذا المربع المكون من 18 دولارًا لتوصيل جميع أجهزتي الذكية في الهواء الطلق بأمان

    6 يونيو, 20254 زيارة
    اختيارات المحرر

    يريد Openai الحصول على أطفال جامعيين على الذكاء الاصطناعي

    8 يونيو, 2025

    تسريب يكشف خطط سوني السرية حول جهاز بلايستيشن المحمول

    8 يونيو, 2025

    من المتوقع أن يكون موضوع الخطوات الأولى ممتازة

    7 يونيو, 2025
    تقنية نيوز
    فيسبوك X (Twitter) الانستغرام يوتيوب لينكدإن تيكتوك
    • الرئيسية
    • سياسة الخصوصية
    • من نحن
    • اتصل بنا
    © 2025 تقنية نيوز. جميع حقوق النشر محفوظة.

    اكتب كلمة البحث ثم اضغط على زر Enter