Close Menu
تقنية نيوزتقنية نيوز
    مقالات قد تهمك

    يحذف Musk “قنبلة كبيرة حقًا” يدعى يظهر ترامب في ملفات إبشتاين

    8 يونيو, 2025

    جوجل تطوّر Gemini بميزة “الإجراءات المجدولة” لتنفيذ المهام تلقائيًا

    8 يونيو, 2025

    يحتوي عرض “Mass Effect” الذي طال انتظاره الآن

    8 يونيو, 2025
    فيسبوك X (Twitter) الانستغرام
    • من نحن
    • سياسة الخصوصية
    • اتصل بنا
    فيسبوك X (Twitter) الانستغرام يوتيوب
    تقنية نيوزتقنية نيوز
    • الرئيسية
    • اخر الاخبار
    • هواتف ذكية
    • كمبيوتر
    • برامج وتطبيقات
    • شركات
      • ابل
      • سامسونج
      • جوجل
      • مايكروسوفت
      • أمازون
    • المزيد
      • الذكاء الإصطناعي
      • الأمن الإلكتروني
      • ألعاب
      • منوعات تقنية
    اشترك معنا
    تقنية نيوزتقنية نيوز
    الرئيسية » ادعاءات ادعاءات Openai تدرب نماذج الذكاء الاصطناعي على البيانات المحمية بحقوق الطبع والنشر
    الذكاء الإصطناعي

    ادعاءات ادعاءات Openai تدرب نماذج الذكاء الاصطناعي على البيانات المحمية بحقوق الطبع والنشر

    فريق التحريربواسطة فريق التحرير2 أبريل, 20253 زيارةلا توجد تعليقات
    شاركها فيسبوك تويتر بينتيريست لينكدإن Tumblr رديت تيلقرام البريد الإلكتروني
    شاركها
    فيسبوك تويتر لينكدإن بينتيريست البريد الإلكتروني

    أثارت دراسة جديدة من مشروع الإفصاح عن الذكاء الاصطناعي أسئلة حول بيانات Openai لتدريب نماذج لغته الكبيرة (LLMS). يشير البحث إلى أن نموذج GPT-4O من Openai يوضح “اعترافًا قويًا” بالبيانات المحفورة بحقوق الطبع والنشر من كتب O'Reilly Media Books.

    يهدف مشروع الإفصاح عن الذكاء الاصطناعى ، بقيادة الفني تيم أوريلي والاقتصادي إيلان شتراوس ، إلى معالجة الآثار المجتمعية الضارة المحتملة لتسويق الذكاء الاصطناعى من خلال الدعوة إلى تحسين الشفافية والتكنولوجية. تبرز ورقة عمل المشروع عدم الإفصاح في الذكاء الاصطناعي ، مما يوجه أوجه التشابه مع معايير الكشف المالي ودورها في تعزيز أسواق الأوراق المالية القوية.

    استخدمت الدراسة مجموعة بيانات تم الحصول عليها قانونًا تضم ​​34 كتبًا وسائط O'Reilly المحمية بحقوق الطبع والنشر للتحقيق فيما إذا تم تدريب LLMs من Openai على بيانات محمية بحقوق الطبع والنشر دون موافقة. طبق الباحثون طريقة هجوم استدلال عضوية DE-COP لتحديد ما إذا كانت النماذج يمكن أن تفرق بين نصوص O'Reilly التي تم تأليفها الإنسان وإصدارات LLM المعاد صياغتها.

    تشمل النتائج الرئيسية من التقرير:

    • يُظهر GPT-4O “اعترافًا قويًا” بمحتوى كتاب O'Reilly Booked ، مع درجة AUROC بنسبة 82 ٪. في المقابل ، لا يظهر النموذج السابق لـ Openai ، GPT-3.5 Turbo ، نفس المستوى من الاعتراف (AUROC PROVER UPPED 50 ٪)
    • يعرض GPT-4O اعترافًا أقوى بمحتوى كتاب O'Reilly غير العام مقارنة بالعينات التي يمكن الوصول إليها للجمهور (82 ٪ مقابل 64 ٪ من درجات AUROC على التوالي)
    • يعرض GPT-3.5 Turbo اعترافًا نسبيًا أكبر لعينات كتاب O'Reilly التي يمكن الوصول إليها للجمهور من غيرها من العروض غير العامة (64 ٪ مقابل 54 ٪ من درجات AUROC)
    • لم يظهر GPT-4O Mini ، وهو نموذج أصغر ، أي معرفة بمحتوى وسائل الإعلام العامة أو غير العامة عند اختباره (AUROC حوالي 50 ٪)

    يقترح الباحثون أن انتهاكات الوصول قد حدثت عبر قاعدة بيانات Libgen ، حيث تم العثور على جميع كتب O'Reilly التي تم اختبارها هناك. كما يقرون أن LLMs الأحدث لديها قدرة محسنة على التمييز بين اللغة التي يتم تأليفها الإنسان وتولدها الرشاشات ، والتي لا تقلل من قدرة الطريقة على تصنيف البيانات.

    تسلط الدراسة الضوء على احتمال “التحيز الزمني” في النتائج ، بسبب تغيرات اللغة مع مرور الوقت. لحساب ذلك ، اختبر الباحثون نموذجين (GPT-4O و GPT-4O Mini) المدربين على البيانات من نفس الفترة.

    يشير التقرير إلى أنه على الرغم من أن الأدلة خاصة بكتب Openai و O'Reilly Media ، فمن المحتمل أن يعكس مشكلة نظامية حول استخدام البيانات المحمية بحقوق الطبع والنشر. يجادل بأن استخدام بيانات التدريب غير المعوّل يمكن أن يؤدي إلى انخفاض في جودة محتوى الإنترنت وتنوعه ، مع انخفاض تدفقات الإيرادات لإنشاء المحتوى المهني.

    يؤكد مشروع إفصاح الذكاء الاصطناعي على الحاجة إلى مساءلة أقوى في عمليات تدريب شركات الذكاء الاصطناعى. ويقترحون أن أحكام المسؤولية التي تحفز شفافية الشركات المحسنة في الكشف عن مصدر البيانات قد تكون خطوة مهمة نحو تسهيل الأسواق التجارية لتدريب ترخيص البيانات والمكافآت.

    يمكن أن تساعد متطلبات الكشف عن قانون AI في الاتحاد الأوروبي في تشغيل دورة معايير الكشف الإيجابية إذا تم تحديدها وتطبيقها بشكل صحيح. التأكد من أن حاملي IP يعرفون متى يتم استخدام عملهم في التدريب النماذج ، يُنظر إلى التدريب على أنه خطوة حاسمة نحو إنشاء أسواق الذكاء الاصطناعى لبيانات منشئ المحتوى.

    على الرغم من الأدلة على أن شركات الذكاء الاصطناعى قد تحصل على بيانات بشكل غير قانوني للتدريب النموذجي ، فإن السوق يبرز حيث يدفع مطورو نموذج الذكاء الاصطناعى للمحتوى من خلال صفقات الترخيص. شركات مثل Defined.ai تسهل شراء بيانات التدريب ، والحصول على موافقة من مقدمي البيانات وتجريد المعلومات الشخصية.

    يخلص التقرير إلى القول إنه باستخدام 34 كتبًا إعلامية لملكية O'Reilly ، تقدم الدراسة أدلة تجريبية على أن Openai من المحتمل أن تدرب GPT-4O على البيانات غير الحكومية المحمية بحقوق الطبع والنشر.

    (صورة بواسطة سيرجي توكماكوف)

    انظر أيضا: يوفر الأنثروبور نظرة ثاقبة على “بيولوجيا الذكاء الاصطناعى” لكلود

    هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الكبيرة من قادة الصناعة؟ تحقق من AI و Big Data Expo الذي يقام في أمستردام ، كاليفورنيا ، ولندن. تم تحديد الحدث الشامل مع الأحداث الرائدة الأخرى بما في ذلك مؤتمر الأتمتة الذكي ، و blockx ، وأسبوع التحول الرقمي ، ومعرض Cyber ​​Security & Cloud.

    استكشاف أحداث وندوات الويب القادمة الأخرى التي تعمل بها TechForge هنا.

    شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr البريد الإلكتروني
    السابقيقول بديساك إنه سيحمي الكتاب المستهدف من قبل حكومة ترامب
    التالي يحتوي Proton Drive على تطبيق MacOS جديد ويبدو رائعًا

    المقالات ذات الصلة

    الذكاء الإصطناعي

    يطلق الأنثروبور نماذج كلود AI للأمن القومي الأمريكي

    6 يونيو, 2025
    الذكاء الإصطناعي

    Reddit يقاضي الأنثروبور على تجريف بيانات الذكاء الاصطناعي

    5 يونيو, 2025
    الذكاء الإصطناعي

    منظمة العفو الدولية تنشر الأمن والحوكمة ، مع Deloitte

    4 يونيو, 2025
    الذكاء الإصطناعي

    منظمة العفو الدولية تتيح التحول من التمكين إلى القيادة الاستراتيجية

    4 يونيو, 2025
    الذكاء الإصطناعي

    يعلم MIT Spinout منظمة العفو الدولية أن تعترف عندما يكون الأمر جاهلًا

    3 يونيو, 2025
    الذكاء الإصطناعي

    يستخدم IBM و Roche منظمة العفو الدولية للتنبؤ بمستويات السكر في الدم

    2 يونيو, 2025
    الذكاء الإصطناعي

    أحدث طراز من الذكاء الاصطناعي لـ Deepseek A “خطوة كبيرة إلى الوراء” لحرية التعبير

    30 مايو, 2025
    الذكاء الإصطناعي

    نموذج AI من Odyssey يحول الفيديو إلى عوالم تفاعلية

    29 مايو, 2025
    الذكاء الإصطناعي

    Huawei Supernode 384 يعطل سوق Nvidia's AI Market

    28 مايو, 2025
    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    Demo
    اخر الاخبار

    كيفية تسجيل مقاطع فيديو محمية بدون شاشة سوداء

    31 يوليو, 2024876 زيارة

    سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

    4 يوليو, 2024694 زيارة

    كل ما تريد معرفته عن Reacher الموسم الثالث

    6 مايو, 2024677 زيارة

    Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

    2 أبريل, 2024646 زيارة

    4 مزايا بطاريات السيليكون الكربونية للهواتف الذكية

    7 مارس, 2024485 زيارة
    رائج الآن
    اخر الاخبار

    يحصل iPhone على أول تطبيق إباحي أصلي له

    فريق التحرير4 فبراير, 2025
    اخر الاخبار

    هل يستمع هاتفك سراً؟ إليك طريقة بسيطة لمعرفة ذلك

    فريق التحرير13 أبريل, 2025
    هواتف ذكية

    Samsung Galaxy Z Fold 6 مقابل Z Fold 5: ما هو المختلف فعليًا؟

    فريق التحرير12 يوليو, 2024
    رائج الآن

    يحصل iPhone على أول تطبيق إباحي أصلي له

    4 فبراير, 202517 زيارة

    هل يستمع هاتفك سراً؟ إليك طريقة بسيطة لمعرفة ذلك

    13 أبريل, 20256 زيارة

    Samsung Galaxy Z Fold 6 مقابل Z Fold 5: ما هو المختلف فعليًا؟

    12 يوليو, 20245 زيارة
    اختيارات المحرر

    يحذف Musk “قنبلة كبيرة حقًا” يدعى يظهر ترامب في ملفات إبشتاين

    8 يونيو, 2025

    جوجل تطوّر Gemini بميزة “الإجراءات المجدولة” لتنفيذ المهام تلقائيًا

    8 يونيو, 2025

    يحتوي عرض “Mass Effect” الذي طال انتظاره الآن

    8 يونيو, 2025
    تقنية نيوز
    فيسبوك X (Twitter) الانستغرام يوتيوب لينكدإن تيكتوك
    • الرئيسية
    • سياسة الخصوصية
    • من نحن
    • اتصل بنا
    © 2025 تقنية نيوز. جميع حقوق النشر محفوظة.

    اكتب كلمة البحث ثم اضغط على زر Enter