Close Menu
تقنية نيوزتقنية نيوز
    مقالات قد تهمك

    يحذف Musk “قنبلة كبيرة حقًا” يدعى يظهر ترامب في ملفات إبشتاين

    8 يونيو, 2025

    جوجل تطوّر Gemini بميزة “الإجراءات المجدولة” لتنفيذ المهام تلقائيًا

    8 يونيو, 2025

    يحتوي عرض “Mass Effect” الذي طال انتظاره الآن

    8 يونيو, 2025
    فيسبوك X (Twitter) الانستغرام
    • من نحن
    • سياسة الخصوصية
    • اتصل بنا
    فيسبوك X (Twitter) الانستغرام يوتيوب
    تقنية نيوزتقنية نيوز
    • الرئيسية
    • اخر الاخبار
    • هواتف ذكية
    • كمبيوتر
    • برامج وتطبيقات
    • شركات
      • ابل
      • سامسونج
      • جوجل
      • مايكروسوفت
      • أمازون
    • المزيد
      • الذكاء الإصطناعي
      • الأمن الإلكتروني
      • ألعاب
      • منوعات تقنية
    اشترك معنا
    تقنية نيوزتقنية نيوز
    الرئيسية » نماذج مكافأة Deepseek's AI: ما يريده البشر حقًا
    الذكاء الإصطناعي

    نماذج مكافأة Deepseek's AI: ما يريده البشر حقًا

    فريق التحريربواسطة فريق التحرير9 أبريل, 20250 زيارةلا توجد تعليقات
    شاركها فيسبوك تويتر بينتيريست لينكدإن Tumblr رديت تيلقرام البريد الإلكتروني
    شاركها
    فيسبوك تويتر لينكدإن بينتيريست البريد الإلكتروني

    لقد حلت شركة Deepseek من الذكاء الاصطناعى الصيني مشكلة تحبط باحثو الذكاء الاصطناعي لعدة سنوات. يمكن أن يحسن طفرة في نماذج مكافآت الذكاء الاصطناعى بشكل كبير كيف تسبب أنظمة الذكاء الاصطناعي والرد على الأسئلة.

    بالشراكة مع باحثو جامعة تينغهوا ، أنشأ ديبسيك تقنية مفصلة في ورقة بحثية بعنوان “تحجيم وقت الاستدلال لنمذجة المكافآت العامة”. إنه يوضح كيف يتفوق نهج جديد على الأساليب الحالية وكيف “حقق الفريق” أداء تنافسي “مقارنة بنماذج المكافآت العامة القوية.

    يركز الابتكار على تعزيز كيفية تعلم أنظمة الذكاء الاصطناعى من التفضيلات البشرية – وهو جانب مهم لإنشاء ذكاء أكثر فائدة ومحاذاة.

    ما هي نماذج مكافأة الذكاء الاصطناعى ، ولماذا يهم؟

    نماذج مكافأة الذكاء الاصطناعى هي مكونات مهمة في التعلم التعزيز لنماذج اللغة الكبيرة. أنها توفر إشارات التغذية المرتدة التي تساعد على توجيه سلوك الذكاء الاصطناعى تجاه النتائج المفضلة. بعبارات أبسط ، تشبه نماذج المكافآت المعلمين الرقميين الذين يساعدون منظمة العفو الدولية على فهم ما يريده البشر من ردودهم.

    “نمذجة المكافآت هي عملية توجه LLM نحو التفضيلات البشرية” ، تقول ورقة Deepseek. تصبح نمذجة المكافآت مهمة حيث تصبح أنظمة الذكاء الاصطناعى أكثر تطوراً ويتم نشرها في سيناريوهات تتجاوز مهام إجابة الأسئلة البسيطة.

    يعالج الابتكار من Deepseek التحدي المتمثل في الحصول على إشارات مكافأة دقيقة لـ LLMs في مجالات مختلفة. في حين أن نماذج المكافآت الحالية تعمل بشكل جيد للأسئلة التي يمكن التحقق منها أو القواعد الاصطناعية ، فإنها تكافح في المجالات العامة حيث تكون المعايير أكثر تنوعًا وتعقيدًا.

    النهج المزدوج: كيف تعمل طريقة Deepseek

    يجمع نهج Deepseek بين طريقتين:

    1. نمذجة المكافآت التوليدية (GRM): يتيح هذا النهج المرونة في أنواع المدخلات المختلفة ويسمح بالتوسع أثناء وقت الاستدلال. على عكس المقاربات العددية أو شبه الفقرية السابقة ، يوفر GRM تمثيلًا أكثر ثراءً للمكافآت من خلال اللغة.
    2. ضبط النقد المُعتمد على الذات (SPCT): طريقة تعليمية تعزز سلوكيات مكافأة القابلة للتطوير في GRMS من خلال التعلم التعزيز عبر الإنترنت ، وهي طريقة تولد مبادئ.

    أوضح أحد مؤلفي الورقة من جامعة Tsinghua و Deepseek-Ai ، Zijun Liu ، أن مزيج الأساليب يسمح بإنشاء مبادئ استنادًا إلى استعلام الإدخال واستجابات ، وعملية توليد المكافآت بشكل تكيفي “.

    يعد هذا النهج ذا قيمة خاصة بالنسبة لإمكانية “تحجيم وقت الاستدلال”-تحسين الأداء عن طريق زيادة الموارد الحسابية أثناء الاستدلال وليس فقط أثناء التدريب.

    وجد الباحثون أن أساليبهم يمكن أن تحقق نتائج أفضل من خلال زيادة أخذ العينات ، مما يتيح للنماذج توليد مكافآت أفضل بمزيد من الحوسبة.

    الآثار المترتبة على صناعة الذكاء الاصطناعي

    يأتي ابتكار Deepseek في وقت مهم في تطوير الذكاء الاصطناعي. تنص الورقة على أن “التعلم التعزيز (RL) قد تم اعتماده على نطاق واسع في ما بعد التدريب لنماذج اللغة الكبيرة (…) على نطاق واسع” ، مما يؤدي إلى “تحسينات ملحوظة في محاذاة القيمة البشرية ، والتفكير طويل الأجل ، والتكيف مع البيئة مع LLMS.”

    يمكن أن يكون النهج الجديد لمكافأة نمذجة العديد من الآثار:

    1. ردود الفعل أكثر دقة: من خلال إنشاء نماذج مكافأة أفضل ، يمكن أن تتلقى أنظمة الذكاء الاصطناعى ملاحظات أكثر دقة حول مخرجاتها ، مما يؤدي إلى تحسين الاستجابات بمرور الوقت.
    2. زيادة القدرة على التكيف: تعني القدرة على توسيع أداء النموذج أثناء الاستدلال أن أنظمة الذكاء الاصطناعى يمكن أن تتكيف مع القيود والمتطلبات الحسابية المختلفة.
    3. تطبيق أوسع: يمكن أن تعمل الأنظمة بشكل أفضل في مجموعة أوسع من المهام من خلال تحسين نمذجة المكافآت للمجالات العامة.
    4. استخدام الموارد الأكثر كفاءة: يوضح البحث أن تحجيم وقت الاستدلال مع طريقة Deepseek قد يتفوق على حجم حجم النموذج في وقت التدريب ، مما قد يسمح للنماذج الأصغر بأداء نماذج مماثلة مع موارد وقت الاستدلال المناسبة.

    تأثير ديبسيك المتزايد

    يضيف التطوير الأخير إلى ملف تعريف Deepseek الصاعد في Global AI. تأسست شركة Hangzhou في عام 2023 من قبل رجل الأعمال Liang Wenfeng ، وقد صنعت شركة Hangzhou مع نماذج V3 ونماذج التفكير R1.

    قامت الشركة بترقية طراز V3 (Deepseek-V3-0324) مؤخرًا ، والتي قالت الشركة إن “إمكانيات التفكير المعززة ، وتطوير الويب الأمامي الأمامي وترقية الكفاءة في الكتابة الصينية”. التزمت Deepseek بمفتوح الذكاء الاصطناعى ، حيث أطلق خمسة مستودعات من الكود في فبراير والتي تسمح للمطورين بمراجعة التطوير والمساهمة به.

    بينما تستمر التكهنات حول الإفراج المحتمل لـ Deepseek-R2 (خليفة R1)- رويترز لقد تكهن في تواريخ الإصدار المحتملة – لم تعلق Deepseek في قنواتها الرسمية.

    ما هو التالي لنماذج مكافأة الذكاء الاصطناعي؟

    وفقًا للباحثين ، تعتزم Deepseek جعل نماذج GRM مفتوحة المصدر ، على الرغم من عدم توفير جدول زمني محدد. سيؤدي التعليم المفتوح إلى تسريع التقدم في هذا المجال من خلال السماح بتجريب أوسع مع نماذج المكافآت.

    مع استمرار التعلم التعزيز في لعب دور مهم في تطوير الذكاء الاصطناعي ، من المحتمل أن يكون للتقدم في نمذجة المكافآت مثل تلك الموجودة في عمل Deepseek و Tsinghua تأثير على قدرات وسلوك أنظمة الذكاء الاصطناعي.

    يوضح العمل على نماذج مكافآت الذكاء الاصطناعى أن الابتكارات في كيفية تعلم النماذج يمكن أن تكون مهمة زيادة حجمها. من خلال التركيز على جودة التغذية المرتدة وقابلية التوسع ، يعالج Deepseek أحد التحديات الأساسية لإنشاء الذكاء الاصطناعى الذي يفهم ويتوافق مع التفضيلات البشرية بشكل أفضل.

    انظر أيضًا: Deepseek Arruption: Depanning AI Innovation يضيق الفجوة التكنولوجية العالمية

    هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الكبيرة من قادة الصناعة؟ تحقق من AI و Big Data Expo الذي يقام في أمستردام ، كاليفورنيا ، ولندن. تم تحديد الحدث الشامل مع الأحداث الرائدة الأخرى بما في ذلك مؤتمر الأتمتة الذكي ، و blockx ، وأسبوع التحول الرقمي ، ومعرض Cyber ​​Security & Cloud.

    استكشاف أحداث وندوات الويب القادمة الأخرى التي تعمل بها TechForge هنا.

    شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr البريد الإلكتروني
    السابقالفحص ثلاثي الأبعاد من حطام تيتانيك يكتشف التضحيات البطولية خلال لحظات السفينة الأخيرة
    التالي قد تحصل Galaxy S26 Ultra على ترقية كاميرا جديدة تمامًا

    المقالات ذات الصلة

    الذكاء الإصطناعي

    يطلق الأنثروبور نماذج كلود AI للأمن القومي الأمريكي

    6 يونيو, 2025
    الذكاء الإصطناعي

    Reddit يقاضي الأنثروبور على تجريف بيانات الذكاء الاصطناعي

    5 يونيو, 2025
    الذكاء الإصطناعي

    منظمة العفو الدولية تنشر الأمن والحوكمة ، مع Deloitte

    4 يونيو, 2025
    الذكاء الإصطناعي

    منظمة العفو الدولية تتيح التحول من التمكين إلى القيادة الاستراتيجية

    4 يونيو, 2025
    الذكاء الإصطناعي

    يعلم MIT Spinout منظمة العفو الدولية أن تعترف عندما يكون الأمر جاهلًا

    3 يونيو, 2025
    الذكاء الإصطناعي

    يستخدم IBM و Roche منظمة العفو الدولية للتنبؤ بمستويات السكر في الدم

    2 يونيو, 2025
    الذكاء الإصطناعي

    أحدث طراز من الذكاء الاصطناعي لـ Deepseek A “خطوة كبيرة إلى الوراء” لحرية التعبير

    30 مايو, 2025
    الذكاء الإصطناعي

    نموذج AI من Odyssey يحول الفيديو إلى عوالم تفاعلية

    29 مايو, 2025
    الذكاء الإصطناعي

    Huawei Supernode 384 يعطل سوق Nvidia's AI Market

    28 مايو, 2025
    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    Demo
    اخر الاخبار

    كيفية تسجيل مقاطع فيديو محمية بدون شاشة سوداء

    31 يوليو, 2024876 زيارة

    سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

    4 يوليو, 2024694 زيارة

    كل ما تريد معرفته عن Reacher الموسم الثالث

    6 مايو, 2024677 زيارة

    Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

    2 أبريل, 2024646 زيارة

    4 مزايا بطاريات السيليكون الكربونية للهواتف الذكية

    7 مارس, 2024485 زيارة
    رائج الآن
    اخر الاخبار

    يحصل iPhone على أول تطبيق إباحي أصلي له

    فريق التحرير4 فبراير, 2025
    اخر الاخبار

    هل يستمع هاتفك سراً؟ إليك طريقة بسيطة لمعرفة ذلك

    فريق التحرير13 أبريل, 2025
    هواتف ذكية

    Samsung Galaxy Z Fold 6 مقابل Z Fold 5: ما هو المختلف فعليًا؟

    فريق التحرير12 يوليو, 2024
    رائج الآن

    يحصل iPhone على أول تطبيق إباحي أصلي له

    4 فبراير, 202517 زيارة

    هل يستمع هاتفك سراً؟ إليك طريقة بسيطة لمعرفة ذلك

    13 أبريل, 20256 زيارة

    Samsung Galaxy Z Fold 6 مقابل Z Fold 5: ما هو المختلف فعليًا؟

    12 يوليو, 20245 زيارة
    اختيارات المحرر

    يحذف Musk “قنبلة كبيرة حقًا” يدعى يظهر ترامب في ملفات إبشتاين

    8 يونيو, 2025

    جوجل تطوّر Gemini بميزة “الإجراءات المجدولة” لتنفيذ المهام تلقائيًا

    8 يونيو, 2025

    يحتوي عرض “Mass Effect” الذي طال انتظاره الآن

    8 يونيو, 2025
    تقنية نيوز
    فيسبوك X (Twitter) الانستغرام يوتيوب لينكدإن تيكتوك
    • الرئيسية
    • سياسة الخصوصية
    • من نحن
    • اتصل بنا
    © 2025 تقنية نيوز. جميع حقوق النشر محفوظة.

    اكتب كلمة البحث ثم اضغط على زر Enter