Close Menu
تقنية نيوزتقنية نيوز

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    مقالات قد تهمك

    كيفية إعداد مفتاح المرور لحساب Microsoft الخاص بك

    30 سبتمبر, 2025

    آبل تطلق تحديث iOS 26.0.1 لإصلاح مشكلات في الكاميرا والاتصال في آيفون 17

    30 سبتمبر, 2025

    سناب شات تطرح خطط تخزين مأجورة لميزة “الذكريات”

    30 سبتمبر, 2025
    فيسبوك X (Twitter) الانستغرام
    • من نحن
    • سياسة الخصوصية
    • اتصل بنا
    فيسبوك X (Twitter) الانستغرام يوتيوب
    تقنية نيوزتقنية نيوز
    • الرئيسية
    • اخر الاخبار
    • هواتف ذكية
    • كمبيوتر
    • برامج وتطبيقات
    • شركات
      • ابل
      • سامسونج
      • جوجل
      • مايكروسوفت
      • أمازون
    • المزيد
      • الذكاء الإصطناعي
      • الأمن الإلكتروني
      • ألعاب
      • منوعات تقنية
    اشترك معنا
    تقنية نيوزتقنية نيوز
    الرئيسية » ادعاءات ادعاءات Openai تدرب نماذج الذكاء الاصطناعي على البيانات المحمية بحقوق الطبع والنشر
    الذكاء الإصطناعي

    ادعاءات ادعاءات Openai تدرب نماذج الذكاء الاصطناعي على البيانات المحمية بحقوق الطبع والنشر

    فريق التحريربواسطة فريق التحرير2 أبريل, 20253 زيارةلا توجد تعليقات
    شاركها فيسبوك تويتر بينتيريست لينكدإن Tumblr رديت تيلقرام البريد الإلكتروني
    شاركها
    فيسبوك تويتر لينكدإن بينتيريست البريد الإلكتروني

    أثارت دراسة جديدة من مشروع الإفصاح عن الذكاء الاصطناعي أسئلة حول بيانات Openai لتدريب نماذج لغته الكبيرة (LLMS). يشير البحث إلى أن نموذج GPT-4O من Openai يوضح “اعترافًا قويًا” بالبيانات المحفورة بحقوق الطبع والنشر من كتب O'Reilly Media Books.

    يهدف مشروع الإفصاح عن الذكاء الاصطناعى ، بقيادة الفني تيم أوريلي والاقتصادي إيلان شتراوس ، إلى معالجة الآثار المجتمعية الضارة المحتملة لتسويق الذكاء الاصطناعى من خلال الدعوة إلى تحسين الشفافية والتكنولوجية. تبرز ورقة عمل المشروع عدم الإفصاح في الذكاء الاصطناعي ، مما يوجه أوجه التشابه مع معايير الكشف المالي ودورها في تعزيز أسواق الأوراق المالية القوية.

    استخدمت الدراسة مجموعة بيانات تم الحصول عليها قانونًا تضم ​​34 كتبًا وسائط O'Reilly المحمية بحقوق الطبع والنشر للتحقيق فيما إذا تم تدريب LLMs من Openai على بيانات محمية بحقوق الطبع والنشر دون موافقة. طبق الباحثون طريقة هجوم استدلال عضوية DE-COP لتحديد ما إذا كانت النماذج يمكن أن تفرق بين نصوص O'Reilly التي تم تأليفها الإنسان وإصدارات LLM المعاد صياغتها.

    تشمل النتائج الرئيسية من التقرير:

    • يُظهر GPT-4O “اعترافًا قويًا” بمحتوى كتاب O'Reilly Booked ، مع درجة AUROC بنسبة 82 ٪. في المقابل ، لا يظهر النموذج السابق لـ Openai ، GPT-3.5 Turbo ، نفس المستوى من الاعتراف (AUROC PROVER UPPED 50 ٪)
    • يعرض GPT-4O اعترافًا أقوى بمحتوى كتاب O'Reilly غير العام مقارنة بالعينات التي يمكن الوصول إليها للجمهور (82 ٪ مقابل 64 ٪ من درجات AUROC على التوالي)
    • يعرض GPT-3.5 Turbo اعترافًا نسبيًا أكبر لعينات كتاب O'Reilly التي يمكن الوصول إليها للجمهور من غيرها من العروض غير العامة (64 ٪ مقابل 54 ٪ من درجات AUROC)
    • لم يظهر GPT-4O Mini ، وهو نموذج أصغر ، أي معرفة بمحتوى وسائل الإعلام العامة أو غير العامة عند اختباره (AUROC حوالي 50 ٪)

    يقترح الباحثون أن انتهاكات الوصول قد حدثت عبر قاعدة بيانات Libgen ، حيث تم العثور على جميع كتب O'Reilly التي تم اختبارها هناك. كما يقرون أن LLMs الأحدث لديها قدرة محسنة على التمييز بين اللغة التي يتم تأليفها الإنسان وتولدها الرشاشات ، والتي لا تقلل من قدرة الطريقة على تصنيف البيانات.

    تسلط الدراسة الضوء على احتمال “التحيز الزمني” في النتائج ، بسبب تغيرات اللغة مع مرور الوقت. لحساب ذلك ، اختبر الباحثون نموذجين (GPT-4O و GPT-4O Mini) المدربين على البيانات من نفس الفترة.

    يشير التقرير إلى أنه على الرغم من أن الأدلة خاصة بكتب Openai و O'Reilly Media ، فمن المحتمل أن يعكس مشكلة نظامية حول استخدام البيانات المحمية بحقوق الطبع والنشر. يجادل بأن استخدام بيانات التدريب غير المعوّل يمكن أن يؤدي إلى انخفاض في جودة محتوى الإنترنت وتنوعه ، مع انخفاض تدفقات الإيرادات لإنشاء المحتوى المهني.

    يؤكد مشروع إفصاح الذكاء الاصطناعي على الحاجة إلى مساءلة أقوى في عمليات تدريب شركات الذكاء الاصطناعى. ويقترحون أن أحكام المسؤولية التي تحفز شفافية الشركات المحسنة في الكشف عن مصدر البيانات قد تكون خطوة مهمة نحو تسهيل الأسواق التجارية لتدريب ترخيص البيانات والمكافآت.

    يمكن أن تساعد متطلبات الكشف عن قانون AI في الاتحاد الأوروبي في تشغيل دورة معايير الكشف الإيجابية إذا تم تحديدها وتطبيقها بشكل صحيح. التأكد من أن حاملي IP يعرفون متى يتم استخدام عملهم في التدريب النماذج ، يُنظر إلى التدريب على أنه خطوة حاسمة نحو إنشاء أسواق الذكاء الاصطناعى لبيانات منشئ المحتوى.

    على الرغم من الأدلة على أن شركات الذكاء الاصطناعى قد تحصل على بيانات بشكل غير قانوني للتدريب النموذجي ، فإن السوق يبرز حيث يدفع مطورو نموذج الذكاء الاصطناعى للمحتوى من خلال صفقات الترخيص. شركات مثل Defined.ai تسهل شراء بيانات التدريب ، والحصول على موافقة من مقدمي البيانات وتجريد المعلومات الشخصية.

    يخلص التقرير إلى القول إنه باستخدام 34 كتبًا إعلامية لملكية O'Reilly ، تقدم الدراسة أدلة تجريبية على أن Openai من المحتمل أن تدرب GPT-4O على البيانات غير الحكومية المحمية بحقوق الطبع والنشر.

    (صورة بواسطة سيرجي توكماكوف)

    انظر أيضا: يوفر الأنثروبور نظرة ثاقبة على “بيولوجيا الذكاء الاصطناعى” لكلود

    هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الكبيرة من قادة الصناعة؟ تحقق من AI و Big Data Expo الذي يقام في أمستردام ، كاليفورنيا ، ولندن. تم تحديد الحدث الشامل مع الأحداث الرائدة الأخرى بما في ذلك مؤتمر الأتمتة الذكي ، و blockx ، وأسبوع التحول الرقمي ، ومعرض Cyber ​​Security & Cloud.

    استكشاف أحداث وندوات الويب القادمة الأخرى التي تعمل بها TechForge هنا.

    شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr البريد الإلكتروني
    السابقيقول بديساك إنه سيحمي الكتاب المستهدف من قبل حكومة ترامب
    التالي يحتوي Proton Drive على تطبيق MacOS جديد ويبدو رائعًا

    المقالات ذات الصلة

    الذكاء الإصطناعي

    يكشف هجوم خصوصية كاميا ما تحفظه نماذج الذكاء الاصطناعي

    26 سبتمبر, 2025
    الذكاء الإصطناعي

    نهج إدارة الأمن السيبراني الأخلاقي في عام 2025

    26 سبتمبر, 2025
    الذكاء الإصطناعي

    تقوم Samsung بتقييم الإنتاجية الحقيقية لنماذج AI للمؤسسات

    25 سبتمبر, 2025
    الذكاء الإصطناعي

    داخل خطة Huawei لجعل الآلاف من رقائق الذكاء الاصطناعى يفكرون ككمبيوتر واحد

    25 سبتمبر, 2025
    الذكاء الإصطناعي

    يأتي التبني بتكلفة أمنية عالية

    24 سبتمبر, 2025
    الذكاء الإصطناعي

    تخطط Openai و Nvidia لصفقة رقاقة بقيمة 100 مليار دولار لمستقبل الذكاء الاصطناعي

    24 سبتمبر, 2025
    الذكاء الإصطناعي

    تحكم عصر العميل الذكاء الاصطناعي: الحكم الذاتي مقابل المساءلة

    24 سبتمبر, 2025
    الذكاء الإصطناعي

    جودة البيانات هي مفتاح النمو الذي يحركه الذكاء الاصطناعي

    23 سبتمبر, 2025
    الذكاء الإصطناعي

    يعتبر عجز الثقة العام عقبة كبيرة لنمو الذكاء الاصطناعي

    22 سبتمبر, 2025
    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    Demo
    اخر الاخبار

    كيفية تسجيل مقاطع فيديو محمية بدون شاشة سوداء

    31 يوليو, 20241٬035 زيارة

    سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

    4 يوليو, 2024789 زيارة

    كل ما تريد معرفته عن Reacher الموسم الثالث

    6 مايو, 2024766 زيارة

    Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

    2 أبريل, 2024714 زيارة

    يحصل iPhone على أول تطبيق إباحي أصلي له

    4 فبراير, 2025629 زيارة

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    رائج الآن
    ألعاب

    يمكنك الآن لعب Hollow Knight: Silksong باللغة العربية

    فريق التحرير20 سبتمبر, 2025
    اخر الاخبار

    تبسيط احتياجات محاسبة عملك مع Intuit QuickBooks ، الآن 64 ٪ خصم

    فريق التحرير28 أبريل, 2025
    اخر الاخبار

    “Night of the Reaper” هو جليسة جليدية رجعية مع تطور الغموض

    فريق التحرير20 سبتمبر, 2025
    رائج الآن

    يمكنك الآن لعب Hollow Knight: Silksong باللغة العربية

    20 سبتمبر, 202517 زيارة

    تبسيط احتياجات محاسبة عملك مع Intuit QuickBooks ، الآن 64 ٪ خصم

    28 أبريل, 202514 زيارة

    “Night of the Reaper” هو جليسة جليدية رجعية مع تطور الغموض

    20 سبتمبر, 202512 زيارة
    اختيارات المحرر

    كيفية إعداد مفتاح المرور لحساب Microsoft الخاص بك

    30 سبتمبر, 2025

    آبل تطلق تحديث iOS 26.0.1 لإصلاح مشكلات في الكاميرا والاتصال في آيفون 17

    30 سبتمبر, 2025

    سناب شات تطرح خطط تخزين مأجورة لميزة “الذكريات”

    30 سبتمبر, 2025

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    تقنية نيوز
    فيسبوك X (Twitter) الانستغرام يوتيوب لينكدإن تيكتوك
    • الرئيسية
    • سياسة الخصوصية
    • من نحن
    • اتصل بنا
    © 2025 تقنية نيوز. جميع حقوق النشر محفوظة.

    اكتب كلمة البحث ثم اضغط على زر Enter