Close Menu
تقنية نيوزتقنية نيوز

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    مقالات قد تهمك

    يعود فيلم “Infinity Castle” إلى دور العرض في اليابان.

    1 فبراير, 2026

    ماينجير تطلق جهاز Retro98 (العودة إلى التسعينيات) للحوسبة.

    1 فبراير, 2026

    يتيح برنامج (ChatGPT Atlas) الآن للمستخدمين تجميع علامات التبويب وتنظيمها.

    1 فبراير, 2026
    فيسبوك X (Twitter) الانستغرام
    • من نحن
    • سياسة الخصوصية
    • اتصل بنا
    فيسبوك X (Twitter) الانستغرام يوتيوب
    تقنية نيوزتقنية نيوز
    • الرئيسية
    • اخر الاخبار
    • هواتف ذكية
    • كمبيوتر
    • برامج وتطبيقات
    • شركات
      • ابل
      • سامسونج
      • جوجل
      • مايكروسوفت
      • أمازون
    • المزيد
      • الذكاء الإصطناعي
      • الأمن الإلكتروني
      • ألعاب
      • منوعات تقنية
    اشترك معنا
    تقنية نيوزتقنية نيوز
    الرئيسية » ادعاءات ادعاءات Openai تدرب نماذج الذكاء الاصطناعي على البيانات المحمية بحقوق الطبع والنشر
    الذكاء الإصطناعي

    ادعاءات ادعاءات Openai تدرب نماذج الذكاء الاصطناعي على البيانات المحمية بحقوق الطبع والنشر

    فريق التحريربواسطة فريق التحرير2 أبريل, 20253 زيارةلا توجد تعليقات
    شاركها فيسبوك تويتر بينتيريست لينكدإن Tumblr رديت تيلقرام البريد الإلكتروني
    شاركها
    فيسبوك تويتر لينكدإن بينتيريست البريد الإلكتروني

    أثارت دراسة جديدة من مشروع الإفصاح عن الذكاء الاصطناعي أسئلة حول بيانات Openai لتدريب نماذج لغته الكبيرة (LLMS). يشير البحث إلى أن نموذج GPT-4O من Openai يوضح “اعترافًا قويًا” بالبيانات المحفورة بحقوق الطبع والنشر من كتب O'Reilly Media Books.

    يهدف مشروع الإفصاح عن الذكاء الاصطناعى ، بقيادة الفني تيم أوريلي والاقتصادي إيلان شتراوس ، إلى معالجة الآثار المجتمعية الضارة المحتملة لتسويق الذكاء الاصطناعى من خلال الدعوة إلى تحسين الشفافية والتكنولوجية. تبرز ورقة عمل المشروع عدم الإفصاح في الذكاء الاصطناعي ، مما يوجه أوجه التشابه مع معايير الكشف المالي ودورها في تعزيز أسواق الأوراق المالية القوية.

    استخدمت الدراسة مجموعة بيانات تم الحصول عليها قانونًا تضم ​​34 كتبًا وسائط O'Reilly المحمية بحقوق الطبع والنشر للتحقيق فيما إذا تم تدريب LLMs من Openai على بيانات محمية بحقوق الطبع والنشر دون موافقة. طبق الباحثون طريقة هجوم استدلال عضوية DE-COP لتحديد ما إذا كانت النماذج يمكن أن تفرق بين نصوص O'Reilly التي تم تأليفها الإنسان وإصدارات LLM المعاد صياغتها.

    تشمل النتائج الرئيسية من التقرير:

    • يُظهر GPT-4O “اعترافًا قويًا” بمحتوى كتاب O'Reilly Booked ، مع درجة AUROC بنسبة 82 ٪. في المقابل ، لا يظهر النموذج السابق لـ Openai ، GPT-3.5 Turbo ، نفس المستوى من الاعتراف (AUROC PROVER UPPED 50 ٪)
    • يعرض GPT-4O اعترافًا أقوى بمحتوى كتاب O'Reilly غير العام مقارنة بالعينات التي يمكن الوصول إليها للجمهور (82 ٪ مقابل 64 ٪ من درجات AUROC على التوالي)
    • يعرض GPT-3.5 Turbo اعترافًا نسبيًا أكبر لعينات كتاب O'Reilly التي يمكن الوصول إليها للجمهور من غيرها من العروض غير العامة (64 ٪ مقابل 54 ٪ من درجات AUROC)
    • لم يظهر GPT-4O Mini ، وهو نموذج أصغر ، أي معرفة بمحتوى وسائل الإعلام العامة أو غير العامة عند اختباره (AUROC حوالي 50 ٪)

    يقترح الباحثون أن انتهاكات الوصول قد حدثت عبر قاعدة بيانات Libgen ، حيث تم العثور على جميع كتب O'Reilly التي تم اختبارها هناك. كما يقرون أن LLMs الأحدث لديها قدرة محسنة على التمييز بين اللغة التي يتم تأليفها الإنسان وتولدها الرشاشات ، والتي لا تقلل من قدرة الطريقة على تصنيف البيانات.

    تسلط الدراسة الضوء على احتمال “التحيز الزمني” في النتائج ، بسبب تغيرات اللغة مع مرور الوقت. لحساب ذلك ، اختبر الباحثون نموذجين (GPT-4O و GPT-4O Mini) المدربين على البيانات من نفس الفترة.

    يشير التقرير إلى أنه على الرغم من أن الأدلة خاصة بكتب Openai و O'Reilly Media ، فمن المحتمل أن يعكس مشكلة نظامية حول استخدام البيانات المحمية بحقوق الطبع والنشر. يجادل بأن استخدام بيانات التدريب غير المعوّل يمكن أن يؤدي إلى انخفاض في جودة محتوى الإنترنت وتنوعه ، مع انخفاض تدفقات الإيرادات لإنشاء المحتوى المهني.

    يؤكد مشروع إفصاح الذكاء الاصطناعي على الحاجة إلى مساءلة أقوى في عمليات تدريب شركات الذكاء الاصطناعى. ويقترحون أن أحكام المسؤولية التي تحفز شفافية الشركات المحسنة في الكشف عن مصدر البيانات قد تكون خطوة مهمة نحو تسهيل الأسواق التجارية لتدريب ترخيص البيانات والمكافآت.

    يمكن أن تساعد متطلبات الكشف عن قانون AI في الاتحاد الأوروبي في تشغيل دورة معايير الكشف الإيجابية إذا تم تحديدها وتطبيقها بشكل صحيح. التأكد من أن حاملي IP يعرفون متى يتم استخدام عملهم في التدريب النماذج ، يُنظر إلى التدريب على أنه خطوة حاسمة نحو إنشاء أسواق الذكاء الاصطناعى لبيانات منشئ المحتوى.

    على الرغم من الأدلة على أن شركات الذكاء الاصطناعى قد تحصل على بيانات بشكل غير قانوني للتدريب النموذجي ، فإن السوق يبرز حيث يدفع مطورو نموذج الذكاء الاصطناعى للمحتوى من خلال صفقات الترخيص. شركات مثل Defined.ai تسهل شراء بيانات التدريب ، والحصول على موافقة من مقدمي البيانات وتجريد المعلومات الشخصية.

    يخلص التقرير إلى القول إنه باستخدام 34 كتبًا إعلامية لملكية O'Reilly ، تقدم الدراسة أدلة تجريبية على أن Openai من المحتمل أن تدرب GPT-4O على البيانات غير الحكومية المحمية بحقوق الطبع والنشر.

    (صورة بواسطة سيرجي توكماكوف)

    انظر أيضا: يوفر الأنثروبور نظرة ثاقبة على “بيولوجيا الذكاء الاصطناعى” لكلود

    هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الكبيرة من قادة الصناعة؟ تحقق من AI و Big Data Expo الذي يقام في أمستردام ، كاليفورنيا ، ولندن. تم تحديد الحدث الشامل مع الأحداث الرائدة الأخرى بما في ذلك مؤتمر الأتمتة الذكي ، و blockx ، وأسبوع التحول الرقمي ، ومعرض Cyber ​​Security & Cloud.

    استكشاف أحداث وندوات الويب القادمة الأخرى التي تعمل بها TechForge هنا.

    شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr البريد الإلكتروني
    السابقيقول بديساك إنه سيحمي الكتاب المستهدف من قبل حكومة ترامب
    التالي يحتوي Proton Drive على تطبيق MacOS جديد ويبدو رائعًا

    المقالات ذات الصلة

    الذكاء الإصطناعي

    يزداد إقبال المسافرين على الذكاء الاصطناعي بالتزامن مع تراجع دور مراكز الاتصال.

    30 يناير, 2026
    الذكاء الإصطناعي

    error code: 524

    29 يناير, 2026
    الذكاء الإصطناعي

    يعرض موقع غالوب (Gallup Workforce) تفاصيل انتشار الذكاء الاصطناعي في أماكن العمل الأمريكية.

    29 يناير, 2026
    الذكاء الإصطناعي

    يتوقع البيت الأبيض أن يعزز نمو الذكاء الاصطناعي الناتج المحلي الإجمالي.

    29 يناير, 2026
    الذكاء الإصطناعي

    فراني هسياو من Salesforce يتحدث عن توسيع نطاق الذكاء الاصطناعي للمؤسسات.

    29 يناير, 2026
    الذكاء الإصطناعي

    يشدد دليل ديلويت للذكاء الاصطناعي على أهمية الحوكمة في (وكالة) الذكاء الاصطناعي.

    28 يناير, 2026
    الذكاء الإصطناعي

    شبكة ماسومي: الذكاء الاصطناعي والبلوكشين يعززان الثقة في اقتصاد الوكيل.

    28 يناير, 2026
    الذكاء الإصطناعي

    يدير بنك ستاندرد تشارترد الذكاء الاصطناعي وفقًا لقواعد الخصوصية.

    28 يناير, 2026
    الذكاء الإصطناعي

    تقليل قيود قواعد البيانات على الاستراتيجية باستخدام RavenDB.

    28 يناير, 2026
    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    Demo
    اخر الاخبار

    مقارنة بين Samsung Galaxy Z Fold 6 و Galaxy S24 Ultra: لا تخطئ

    25 يوليو, 20241٬177 زيارة

    سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

    4 يوليو, 2024818 زيارة

    يحصل iPhone على أول تطبيق إباحي أصلي له

    4 فبراير, 2025784 زيارة

    كل ما تريد معرفته عن Reacher الموسم الثالث

    6 مايو, 2024778 زيارة

    Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

    2 أبريل, 2024722 زيارة

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    رائج الآن
    ألعاب

    الإعلان عن الموسم الثالث من أنمي جوجوتسو كايسن الموسم 3 بعنوان “The Culling Game”

    فريق التحرير31 أغسطس, 2025
    اخر الاخبار

    أفضل الألعاب الجنسية في معرض CES 2025

    فريق التحرير13 يناير, 2025
    ألعاب

    أفضل 10 ألعاب مجانية على الهاتف المحمول 2024، مع روابط تحميلها المباشرة

    فريق التحرير29 يوليو, 2024
    رائج الآن

    الإعلان عن الموسم الثالث من أنمي جوجوتسو كايسن الموسم 3 بعنوان “The Culling Game”

    31 أغسطس, 202510 زيارة

    أفضل الألعاب الجنسية في معرض CES 2025

    13 يناير, 20257 زيارة

    أفضل 10 ألعاب مجانية على الهاتف المحمول 2024، مع روابط تحميلها المباشرة

    29 يوليو, 20247 زيارة
    اختيارات المحرر

    يعود فيلم “Infinity Castle” إلى دور العرض في اليابان.

    1 فبراير, 2026

    ماينجير تطلق جهاز Retro98 (العودة إلى التسعينيات) للحوسبة.

    1 فبراير, 2026

    يتيح برنامج (ChatGPT Atlas) الآن للمستخدمين تجميع علامات التبويب وتنظيمها.

    1 فبراير, 2026

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    تقنية نيوز
    فيسبوك X (Twitter) الانستغرام يوتيوب لينكدإن تيكتوك
    • الرئيسية
    • سياسة الخصوصية
    • من نحن
    • اتصل بنا
    © 2026 تقنية نيوز. جميع حقوق النشر محفوظة.

    اكتب كلمة البحث ثم اضغط على زر Enter