Close Menu
تقنية نيوزتقنية نيوز

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    مقالات قد تهمك

    تدعم أدوبي الأمان في برامج Lightroom وInDesign وAfter Effects.

    11 فبراير, 2026

    عروض أجهزة الكمبيوتر المحمول في (يوم الرؤساء): تخفيضات على أجهزة العمل والألعاب.

    11 فبراير, 2026

    هاتف سامسونج غالاكسي Z تري فولد (TriFold) معروض للبيع بسعر يقارب 3000 دولار.

    10 فبراير, 2026
    فيسبوك X (Twitter) الانستغرام
    • من نحن
    • سياسة الخصوصية
    • اتصل بنا
    فيسبوك X (Twitter) الانستغرام يوتيوب
    تقنية نيوزتقنية نيوز
    • الرئيسية
    • اخر الاخبار
    • هواتف ذكية
    • كمبيوتر
    • برامج وتطبيقات
    • شركات
      • ابل
      • سامسونج
      • جوجل
      • مايكروسوفت
      • أمازون
    • المزيد
      • الذكاء الإصطناعي
      • الأمن الإلكتروني
      • ألعاب
      • منوعات تقنية
    اشترك معنا
    تقنية نيوزتقنية نيوز
    الرئيسية » جامعة هارفارد توفر مليون كتاب لتدريب نماذج الذكاء الاصطناعي
    اخر الاخبار

    جامعة هارفارد توفر مليون كتاب لتدريب نماذج الذكاء الاصطناعي

    فريق التحريربواسطة فريق التحرير13 ديسمبر, 20240 زيارةلا توجد تعليقات
    شاركها فيسبوك تويتر بينتيريست لينكدإن Tumblr رديت تيلقرام البريد الإلكتروني
    شاركها
    فيسبوك تويتر لينكدإن بينتيريست البريد الإلكتروني

    البيانات هي النفط الجديد، كما يقولون، وربما هذا يجعل من جامعة هارفارد شركة إكسون الجديدة. أعلنت المدرسة يوم الخميس عن إطلاق مجموعة بيانات تحتوي على ما يقرب من مليون كتاب ذو ملكية عامة يمكن استخدامها لتدريب نماذج الذكاء الاصطناعي. وبموجب مبادرة البيانات المؤسسية التي تم تشكيلها حديثًا، تلقى المشروع تمويلًا من كل من Microsoft وOpenAI، ويحتوي على كتب تم مسحها ضوئيًا بواسطة Google Books وهي قديمة بما يكفي لانتهاء صلاحية حماية حقوق الطبع والنشر الخاصة بها.

    سلكي في مقال عن المشروع الجديد، يقول إن مجموعة البيانات تتضمن مجموعة واسعة من الكتب التي تحتوي على “كلاسيكيات شكسبير وتشارلز ديكنز ودانتي جنبًا إلى جنب مع كتب الرياضيات التشيكية الغامضة وقواميس الجيب الويلزية”. كقاعدة عامة، تستمر حماية حقوق النشر طوال عمر المؤلف بالإضافة إلى 70 عامًا إضافية.

    تتطلب نماذج اللغة الأساسية، مثل ChatGPT، التي تتصرف وكأنها نسخة واقعية من إنسان حقيقي، قدرًا هائلاً من النصوص عالية الجودة لتدريبها – وبشكل عام، كلما زادت المعلومات التي تستوعبها، كان أداء النماذج أفضل في تقليد البشر وخدمة المعرفة. لكن هذا التعطش للبيانات تسبب في حدوث مشكلات، حيث اصطدمت أمثال OpenAI بجدران بشأن مقدار المعلومات الجديدة التي يمكنها العثور عليها – دون سرقتها، على الأقل.

    الناشرين بما في ذلك وول ستريت جورنال و نيويورك تايمز رفعوا دعوى قضائية ضد OpenAI والمنافس Perplexity لاستيعاب بياناتهم دون إذن. قدم أنصار شركات الذكاء الاصطناعي حججًا مختلفة للدفاع عن أنشطتهم. سيقولون أحيانًا أن البشر أنفسهم ينتجون أعمالًا جديدة بناءً على دراسة وتوليف المواد من مصادر أخرى، ولا يختلف الذكاء الاصطناعي عن ذلك. يذهب الجميع إلى المدرسة، ويقرأون الكتب، ثم ينتجون أعمالًا جديدة باستخدام المعرفة التي اكتسبوها. يعتبر إعادة المزج من الناحية القانونية استخدامًا عادلاً إذا كان الإنشاء الجديد مختلفًا بشكل جوهري. لكن هذا لا يأخذ في الاعتبار أن البشر لا يستطيعون استيعاب مليارات الأجزاء من النص بالسرعة التي يستطيع بها الكمبيوتر، لذا فهي ليست مقارنة عادلة تمامًا. ال وول ستريت جورنال وقالت في الدعوى المرفوعة ضد شركة Perplexity إن الشركة الناشئة “تنسخ على نطاق واسع”.

    طرح اللاعبون في هذا المجال أيضًا الحجة القائلة بأن أي محتوى متاح على الويب المفتوح هو في الأساس لعبة عادلة وأن مستخدم برنامج الدردشة الآلي هو الشخص الذي يصل إلى المحتوى المحمي بحقوق الطبع والنشر عن طريق طلبه من خلال المطالبة. في الأساس، يشبه برنامج الدردشة الآلي مثل Perplexity متصفح الويب. سوف يستغرق الأمر بعض الوقت قبل أن يتم عرض هذه الحجج في المحكمة.

    أبرمت شركة OpenAI صفقات مع بعض موفري المحتوى ردًا على الانتقادات، كما أطلقت شركة Perplexity برنامج شركاء مدعومًا بالإعلانات مع الناشرين. لكن من الواضح أنهم فعلوا ذلك على مضض.

    في الوقت نفسه الذي تعاني فيه شركات الذكاء الاصطناعي من نفاد المحتوى الجديد الذي يمكن استخدامه، بدأت مصادر الويب شائعة الاستخدام والتي تم تضمينها بالفعل في مجموعات التدريب في تقييد الوصول بسرعة. كانت الشركات، بما في ذلك Reddit وX، صارمة بشأن الحد من استخدام بياناتها لأنها أدركت قيمتها الهائلة، خاصة في الحصول على بيانات في الوقت الفعلي لتعزيز النماذج الأساسية بمزيد من المعلومات الحديثة عن العالم.

    تجني Reddit مئات الملايين من الدولارات من ترخيص مجموعة من المنتديات الفرعية والتعليقات الخاصة بها إلى Google لتدريب نماذجها. لدى Elon Musk's X ترتيب حصري مع شركته الأخرى، xAI، لمنح نماذجها إمكانية الوصول إلى محتوى الشبكة الاجتماعية للتدريب واسترجاع المعلومات الحالية. ومن المثير للسخرية أن نعتبر أن هذه الشركات تحرس بياناتها الخاصة عن كثب، ولكنها تعتقد بشكل أساسي أن المحتوى الذي يقدمه ناشرو الوسائط ليس له قيمة ويجب أن يكون مجانيًا.

    لن يكون مليون كتاب كافيًا لتلبية الاحتياجات التدريبية لأي شركة ذكاء اصطناعي، خاصة وأن هذه الكتب قديمة ولا تحتوي على معلومات حديثة، مثل اللغة العامية التي يستخدمها أطفال الجيل Z. ومن أجل تمييز نفسها عن المنافسين، سوف ترغب شركات الذكاء الاصطناعي في الاستمرار في الوصول إلى البيانات الأخرى – وخاصة النوع الحصري – بحيث لا تقوم جميعها بإنشاء نماذج متماثلة. يمكن لمجموعة بيانات مبادرة البيانات المؤسسية أن تقدم على الأقل بعض المساعدة لشركات الذكاء الاصطناعي التي تحاول تدريب نماذجها التأسيسية الأولية دون الوقوع في أي مشكلة قانونية.

    شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr البريد الإلكتروني
    السابقيتحدث الناس بالفعل عن شريحة Snapdragon الكبيرة التالية
    التالي تفاصيل جديدة حول لعبة Naughty Dog الجديدة Intergalactic

    المقالات ذات الصلة

    اخر الاخبار

    تدعم أدوبي الأمان في برامج Lightroom وInDesign وAfter Effects.

    11 فبراير, 2026
    اخر الاخبار

    يتوفر ترخيص ويندوز مدى الحياة مع تحرير من اشتراكات Office بسعر 20 دولارًا.

    10 فبراير, 2026
    اخر الاخبار

    تكلفة برنامج (MS Project) 2024 تبلغ 45 دولارًا للتخطيط والتتبع والتسليم.

    9 فبراير, 2026
    اخر الاخبار

    يوفر حاسوب “إتش بي” الصغير أداءً قوياً بسعر 350 دولاراً.

    8 فبراير, 2026
    اخر الاخبار

    باحثون يطلبون من سائقي السيارات شرح إشارات راكبي الدراجات بعد صعوبات.

    6 فبراير, 2026
    اخر الاخبار

    مراجعة كاميرا Blink Mini 2K+: تحسينات تدريجية في كاميرا صغيرة الحجم.

    4 فبراير, 2026
    اخر الاخبار

    تجاوز (Roulette) المدعومة بالذكاء الاصطناعي وقارن النماذج الأفضل فورًا بخطة دائمة مقابل 79 دولارًا.

    2 فبراير, 2026
    اخر الاخبار

    يعود فيلم “Infinity Castle” إلى دور العرض في اليابان.

    1 فبراير, 2026
    اخر الاخبار

    هوليوود تنعى وفاة كاثرين أوهارا المفاجئة.

    31 يناير, 2026
    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    Demo
    اخر الاخبار

    مقارنة بين Samsung Galaxy Z Fold 6 و Galaxy S24 Ultra: لا تخطئ

    25 يوليو, 20241٬178 زيارة

    سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

    4 يوليو, 2024820 زيارة

    يحصل iPhone على أول تطبيق إباحي أصلي له

    4 فبراير, 2025792 زيارة

    كل ما تريد معرفته عن Reacher الموسم الثالث

    6 مايو, 2024779 زيارة

    Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

    2 أبريل, 2024723 زيارة

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    رائج الآن
    اخر الاخبار

    تبسيط احتياجات محاسبة عملك مع Intuit QuickBooks ، الآن 64 ٪ خصم

    فريق التحرير28 أبريل, 2025
    اخر الاخبار

    هل تريد التحول من Chrome؟ كيفية استخدام Arc، المتصفح الذي يجرؤ على الابتكار

    فريق التحرير20 سبتمبر, 2024
    منوعات تقنية

    شات جي بي تي بدون تسجيل.. ChatGPT مجانا بالعربي

    فريق التحرير20 مايو, 2025
    رائج الآن

    تبسيط احتياجات محاسبة عملك مع Intuit QuickBooks ، الآن 64 ٪ خصم

    28 أبريل, 202514 زيارة

    هل تريد التحول من Chrome؟ كيفية استخدام Arc، المتصفح الذي يجرؤ على الابتكار

    20 سبتمبر, 20249 زيارة

    شات جي بي تي بدون تسجيل.. ChatGPT مجانا بالعربي

    20 مايو, 20258 زيارة
    اختيارات المحرر

    تدعم أدوبي الأمان في برامج Lightroom وInDesign وAfter Effects.

    11 فبراير, 2026

    عروض أجهزة الكمبيوتر المحمول في (يوم الرؤساء): تخفيضات على أجهزة العمل والألعاب.

    11 فبراير, 2026

    هاتف سامسونج غالاكسي Z تري فولد (TriFold) معروض للبيع بسعر يقارب 3000 دولار.

    10 فبراير, 2026

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    تقنية نيوز
    فيسبوك X (Twitter) الانستغرام يوتيوب لينكدإن تيكتوك
    • الرئيسية
    • سياسة الخصوصية
    • من نحن
    • اتصل بنا
    © 2026 تقنية نيوز. جميع حقوق النشر محفوظة.

    اكتب كلمة البحث ثم اضغط على زر Enter