Close Menu
تقنية نيوزتقنية نيوز
    مقالات قد تهمك

    يعيد Amazon إعادة صياغة محرك Seagate 22tb الخارجي ، والآن 60 ٪ من السعر الأصلي

    12 مايو, 2025

    هل لا يوجد شيء جديد هو هاتف CMF أو يكسر في اختبار المتانة؟

    12 مايو, 2025

    بلوتوث 6.1 يُعزّز الخصوصية وكفاءة استهلاك الطاقة

    12 مايو, 2025
    فيسبوك X (Twitter) الانستغرام
    • من نحن
    • سياسة الخصوصية
    • اتصل بنا
    فيسبوك X (Twitter) الانستغرام يوتيوب
    تقنية نيوزتقنية نيوز
    • الرئيسية
    • اخر الاخبار
    • هواتف ذكية
    • كمبيوتر
    • برامج وتطبيقات
    • شركات
      • ابل
      • سامسونج
      • جوجل
      • مايكروسوفت
      • أمازون
    • المزيد
      • الذكاء الإصطناعي
      • الأمن الإلكتروني
      • ألعاب
      • منوعات تقنية
    اشترك معنا
    تقنية نيوزتقنية نيوز
    الرئيسية » جامعة هارفارد توفر مليون كتاب لتدريب نماذج الذكاء الاصطناعي
    اخر الاخبار

    جامعة هارفارد توفر مليون كتاب لتدريب نماذج الذكاء الاصطناعي

    فريق التحريربواسطة فريق التحرير13 ديسمبر, 20240 زيارةلا توجد تعليقات
    شاركها فيسبوك تويتر بينتيريست لينكدإن Tumblr رديت تيلقرام البريد الإلكتروني
    شاركها
    فيسبوك تويتر لينكدإن بينتيريست البريد الإلكتروني

    البيانات هي النفط الجديد، كما يقولون، وربما هذا يجعل من جامعة هارفارد شركة إكسون الجديدة. أعلنت المدرسة يوم الخميس عن إطلاق مجموعة بيانات تحتوي على ما يقرب من مليون كتاب ذو ملكية عامة يمكن استخدامها لتدريب نماذج الذكاء الاصطناعي. وبموجب مبادرة البيانات المؤسسية التي تم تشكيلها حديثًا، تلقى المشروع تمويلًا من كل من Microsoft وOpenAI، ويحتوي على كتب تم مسحها ضوئيًا بواسطة Google Books وهي قديمة بما يكفي لانتهاء صلاحية حماية حقوق الطبع والنشر الخاصة بها.

    سلكي في مقال عن المشروع الجديد، يقول إن مجموعة البيانات تتضمن مجموعة واسعة من الكتب التي تحتوي على “كلاسيكيات شكسبير وتشارلز ديكنز ودانتي جنبًا إلى جنب مع كتب الرياضيات التشيكية الغامضة وقواميس الجيب الويلزية”. كقاعدة عامة، تستمر حماية حقوق النشر طوال عمر المؤلف بالإضافة إلى 70 عامًا إضافية.

    تتطلب نماذج اللغة الأساسية، مثل ChatGPT، التي تتصرف وكأنها نسخة واقعية من إنسان حقيقي، قدرًا هائلاً من النصوص عالية الجودة لتدريبها – وبشكل عام، كلما زادت المعلومات التي تستوعبها، كان أداء النماذج أفضل في تقليد البشر وخدمة المعرفة. لكن هذا التعطش للبيانات تسبب في حدوث مشكلات، حيث اصطدمت أمثال OpenAI بجدران بشأن مقدار المعلومات الجديدة التي يمكنها العثور عليها – دون سرقتها، على الأقل.

    الناشرين بما في ذلك وول ستريت جورنال و نيويورك تايمز رفعوا دعوى قضائية ضد OpenAI والمنافس Perplexity لاستيعاب بياناتهم دون إذن. قدم أنصار شركات الذكاء الاصطناعي حججًا مختلفة للدفاع عن أنشطتهم. سيقولون أحيانًا أن البشر أنفسهم ينتجون أعمالًا جديدة بناءً على دراسة وتوليف المواد من مصادر أخرى، ولا يختلف الذكاء الاصطناعي عن ذلك. يذهب الجميع إلى المدرسة، ويقرأون الكتب، ثم ينتجون أعمالًا جديدة باستخدام المعرفة التي اكتسبوها. يعتبر إعادة المزج من الناحية القانونية استخدامًا عادلاً إذا كان الإنشاء الجديد مختلفًا بشكل جوهري. لكن هذا لا يأخذ في الاعتبار أن البشر لا يستطيعون استيعاب مليارات الأجزاء من النص بالسرعة التي يستطيع بها الكمبيوتر، لذا فهي ليست مقارنة عادلة تمامًا. ال وول ستريت جورنال وقالت في الدعوى المرفوعة ضد شركة Perplexity إن الشركة الناشئة “تنسخ على نطاق واسع”.

    طرح اللاعبون في هذا المجال أيضًا الحجة القائلة بأن أي محتوى متاح على الويب المفتوح هو في الأساس لعبة عادلة وأن مستخدم برنامج الدردشة الآلي هو الشخص الذي يصل إلى المحتوى المحمي بحقوق الطبع والنشر عن طريق طلبه من خلال المطالبة. في الأساس، يشبه برنامج الدردشة الآلي مثل Perplexity متصفح الويب. سوف يستغرق الأمر بعض الوقت قبل أن يتم عرض هذه الحجج في المحكمة.

    أبرمت شركة OpenAI صفقات مع بعض موفري المحتوى ردًا على الانتقادات، كما أطلقت شركة Perplexity برنامج شركاء مدعومًا بالإعلانات مع الناشرين. لكن من الواضح أنهم فعلوا ذلك على مضض.

    في الوقت نفسه الذي تعاني فيه شركات الذكاء الاصطناعي من نفاد المحتوى الجديد الذي يمكن استخدامه، بدأت مصادر الويب شائعة الاستخدام والتي تم تضمينها بالفعل في مجموعات التدريب في تقييد الوصول بسرعة. كانت الشركات، بما في ذلك Reddit وX، صارمة بشأن الحد من استخدام بياناتها لأنها أدركت قيمتها الهائلة، خاصة في الحصول على بيانات في الوقت الفعلي لتعزيز النماذج الأساسية بمزيد من المعلومات الحديثة عن العالم.

    تجني Reddit مئات الملايين من الدولارات من ترخيص مجموعة من المنتديات الفرعية والتعليقات الخاصة بها إلى Google لتدريب نماذجها. لدى Elon Musk's X ترتيب حصري مع شركته الأخرى، xAI، لمنح نماذجها إمكانية الوصول إلى محتوى الشبكة الاجتماعية للتدريب واسترجاع المعلومات الحالية. ومن المثير للسخرية أن نعتبر أن هذه الشركات تحرس بياناتها الخاصة عن كثب، ولكنها تعتقد بشكل أساسي أن المحتوى الذي يقدمه ناشرو الوسائط ليس له قيمة ويجب أن يكون مجانيًا.

    لن يكون مليون كتاب كافيًا لتلبية الاحتياجات التدريبية لأي شركة ذكاء اصطناعي، خاصة وأن هذه الكتب قديمة ولا تحتوي على معلومات حديثة، مثل اللغة العامية التي يستخدمها أطفال الجيل Z. ومن أجل تمييز نفسها عن المنافسين، سوف ترغب شركات الذكاء الاصطناعي في الاستمرار في الوصول إلى البيانات الأخرى – وخاصة النوع الحصري – بحيث لا تقوم جميعها بإنشاء نماذج متماثلة. يمكن لمجموعة بيانات مبادرة البيانات المؤسسية أن تقدم على الأقل بعض المساعدة لشركات الذكاء الاصطناعي التي تحاول تدريب نماذجها التأسيسية الأولية دون الوقوع في أي مشكلة قانونية.

    شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr البريد الإلكتروني
    السابقيتحدث الناس بالفعل عن شريحة Snapdragon الكبيرة التالية
    التالي تفاصيل جديدة حول لعبة Naughty Dog الجديدة Intergalactic

    المقالات ذات الصلة

    اخر الاخبار

    يعيد Amazon إعادة صياغة محرك Seagate 22tb الخارجي ، والآن 60 ٪ من السعر الأصلي

    12 مايو, 2025
    اخر الاخبار

    هامش صفر على AirPods Pro 2 ، تقوم Amazon بمسح جميع الأسهم بسعر منخفض

    12 مايو, 2025
    اخر الاخبار

    هذا هو واحد من أرخص نماذج Dyson على الإطلاق ، والآن قريب جدًا من سجلها المنخفض

    12 مايو, 2025
    اخر الاخبار

    يقع Amazon هذا على ارتفاع 24000 مللي أمبير في ANKER POWER BANK بالقرب من انخفاض قياسي.

    12 مايو, 2025
    اخر الاخبار

    انتقام من كاتب لعبة Sith ينظر إلى النهاية بديلة

    12 مايو, 2025
    اخر الاخبار

    Moderna's Super-Vancine for Flu و Covid Works-الآن يمكن للسياسة أن تغرقها

    12 مايو, 2025
    اخر الاخبار

    يلقي مخرج تاكر ودايل باللوم على ديفيد زاسلاف لقتله عبر التلفزيون

    11 مايو, 2025
    اخر الاخبار

    يقال إن ترامب يطلق النار على مكتب حقوق الطبع والنشر لنا

    11 مايو, 2025
    اخر الاخبار

    Godzilla x Kong يسير Supernova ، ماذا يمكن أن يعني ذلك؟

    11 مايو, 2025
    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    Demo
    اخر الاخبار

    كيفية تسجيل مقاطع فيديو محمية بدون شاشة سوداء

    31 يوليو, 2024832 زيارة

    سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

    4 يوليو, 2024692 زيارة

    كل ما تريد معرفته عن Reacher الموسم الثالث

    6 مايو, 2024670 زيارة

    Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

    2 أبريل, 2024646 زيارة

    4 مزايا بطاريات السيليكون الكربونية للهواتف الذكية

    7 مارس, 2024484 زيارة
    رائج الآن
    اخر الاخبار

    يحصل iPhone على أول تطبيق إباحي أصلي له

    فريق التحرير4 فبراير, 2025
    اخر الاخبار

    كيفية تسجيل مقاطع فيديو محمية بدون شاشة سوداء

    فريق التحرير31 يوليو, 2024
    كمبيوتر

    كيفية حذف الدردشات في Character.AI

    فريق التحرير14 يونيو, 2024
    رائج الآن

    يحصل iPhone على أول تطبيق إباحي أصلي له

    4 فبراير, 202523 زيارة

    كيفية تسجيل مقاطع فيديو محمية بدون شاشة سوداء

    31 يوليو, 20249 زيارة

    كيفية حذف الدردشات في Character.AI

    14 يونيو, 20247 زيارة
    اختيارات المحرر

    يعيد Amazon إعادة صياغة محرك Seagate 22tb الخارجي ، والآن 60 ٪ من السعر الأصلي

    12 مايو, 2025

    هل لا يوجد شيء جديد هو هاتف CMF أو يكسر في اختبار المتانة؟

    12 مايو, 2025

    بلوتوث 6.1 يُعزّز الخصوصية وكفاءة استهلاك الطاقة

    12 مايو, 2025
    تقنية نيوز
    فيسبوك X (Twitter) الانستغرام يوتيوب لينكدإن تيكتوك
    • الرئيسية
    • سياسة الخصوصية
    • من نحن
    • اتصل بنا
    © 2025 تقنية نيوز. جميع حقوق النشر محفوظة.

    اكتب كلمة البحث ثم اضغط على زر Enter