Close Menu
تقنية نيوزتقنية نيوز

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    مقالات قد تهمك

    ترفع شركة Framework أسعار ذاكرة الوصول العشوائي للحواسيب المحمولة بنسبة 50% وسط أزمة مستمرة.

    14 ديسمبر, 2025

    مُخترِع لعبة “Tomb Raider” يُعلّق على إعادة إنتاج (Remake) “Legacy of Atlantis”.

    14 ديسمبر, 2025

    شركة بيست باي تُقدم خصمًا بقيمة 250 دولارًا على طرز M4 MacBook Pro اليوم.

    14 ديسمبر, 2025
    فيسبوك X (Twitter) الانستغرام
    • من نحن
    • سياسة الخصوصية
    • اتصل بنا
    فيسبوك X (Twitter) الانستغرام يوتيوب
    تقنية نيوزتقنية نيوز
    • الرئيسية
    • اخر الاخبار
    • هواتف ذكية
    • كمبيوتر
    • برامج وتطبيقات
    • شركات
      • ابل
      • سامسونج
      • جوجل
      • مايكروسوفت
      • أمازون
    • المزيد
      • الذكاء الإصطناعي
      • الأمن الإلكتروني
      • ألعاب
      • منوعات تقنية
    اشترك معنا
    تقنية نيوزتقنية نيوز
    الرئيسية » جامعة هارفارد توفر مليون كتاب لتدريب نماذج الذكاء الاصطناعي
    اخر الاخبار

    جامعة هارفارد توفر مليون كتاب لتدريب نماذج الذكاء الاصطناعي

    فريق التحريربواسطة فريق التحرير13 ديسمبر, 20240 زيارةلا توجد تعليقات
    شاركها فيسبوك تويتر بينتيريست لينكدإن Tumblr رديت تيلقرام البريد الإلكتروني
    شاركها
    فيسبوك تويتر لينكدإن بينتيريست البريد الإلكتروني

    البيانات هي النفط الجديد، كما يقولون، وربما هذا يجعل من جامعة هارفارد شركة إكسون الجديدة. أعلنت المدرسة يوم الخميس عن إطلاق مجموعة بيانات تحتوي على ما يقرب من مليون كتاب ذو ملكية عامة يمكن استخدامها لتدريب نماذج الذكاء الاصطناعي. وبموجب مبادرة البيانات المؤسسية التي تم تشكيلها حديثًا، تلقى المشروع تمويلًا من كل من Microsoft وOpenAI، ويحتوي على كتب تم مسحها ضوئيًا بواسطة Google Books وهي قديمة بما يكفي لانتهاء صلاحية حماية حقوق الطبع والنشر الخاصة بها.

    سلكي في مقال عن المشروع الجديد، يقول إن مجموعة البيانات تتضمن مجموعة واسعة من الكتب التي تحتوي على “كلاسيكيات شكسبير وتشارلز ديكنز ودانتي جنبًا إلى جنب مع كتب الرياضيات التشيكية الغامضة وقواميس الجيب الويلزية”. كقاعدة عامة، تستمر حماية حقوق النشر طوال عمر المؤلف بالإضافة إلى 70 عامًا إضافية.

    تتطلب نماذج اللغة الأساسية، مثل ChatGPT، التي تتصرف وكأنها نسخة واقعية من إنسان حقيقي، قدرًا هائلاً من النصوص عالية الجودة لتدريبها – وبشكل عام، كلما زادت المعلومات التي تستوعبها، كان أداء النماذج أفضل في تقليد البشر وخدمة المعرفة. لكن هذا التعطش للبيانات تسبب في حدوث مشكلات، حيث اصطدمت أمثال OpenAI بجدران بشأن مقدار المعلومات الجديدة التي يمكنها العثور عليها – دون سرقتها، على الأقل.

    الناشرين بما في ذلك وول ستريت جورنال و نيويورك تايمز رفعوا دعوى قضائية ضد OpenAI والمنافس Perplexity لاستيعاب بياناتهم دون إذن. قدم أنصار شركات الذكاء الاصطناعي حججًا مختلفة للدفاع عن أنشطتهم. سيقولون أحيانًا أن البشر أنفسهم ينتجون أعمالًا جديدة بناءً على دراسة وتوليف المواد من مصادر أخرى، ولا يختلف الذكاء الاصطناعي عن ذلك. يذهب الجميع إلى المدرسة، ويقرأون الكتب، ثم ينتجون أعمالًا جديدة باستخدام المعرفة التي اكتسبوها. يعتبر إعادة المزج من الناحية القانونية استخدامًا عادلاً إذا كان الإنشاء الجديد مختلفًا بشكل جوهري. لكن هذا لا يأخذ في الاعتبار أن البشر لا يستطيعون استيعاب مليارات الأجزاء من النص بالسرعة التي يستطيع بها الكمبيوتر، لذا فهي ليست مقارنة عادلة تمامًا. ال وول ستريت جورنال وقالت في الدعوى المرفوعة ضد شركة Perplexity إن الشركة الناشئة “تنسخ على نطاق واسع”.

    طرح اللاعبون في هذا المجال أيضًا الحجة القائلة بأن أي محتوى متاح على الويب المفتوح هو في الأساس لعبة عادلة وأن مستخدم برنامج الدردشة الآلي هو الشخص الذي يصل إلى المحتوى المحمي بحقوق الطبع والنشر عن طريق طلبه من خلال المطالبة. في الأساس، يشبه برنامج الدردشة الآلي مثل Perplexity متصفح الويب. سوف يستغرق الأمر بعض الوقت قبل أن يتم عرض هذه الحجج في المحكمة.

    أبرمت شركة OpenAI صفقات مع بعض موفري المحتوى ردًا على الانتقادات، كما أطلقت شركة Perplexity برنامج شركاء مدعومًا بالإعلانات مع الناشرين. لكن من الواضح أنهم فعلوا ذلك على مضض.

    في الوقت نفسه الذي تعاني فيه شركات الذكاء الاصطناعي من نفاد المحتوى الجديد الذي يمكن استخدامه، بدأت مصادر الويب شائعة الاستخدام والتي تم تضمينها بالفعل في مجموعات التدريب في تقييد الوصول بسرعة. كانت الشركات، بما في ذلك Reddit وX، صارمة بشأن الحد من استخدام بياناتها لأنها أدركت قيمتها الهائلة، خاصة في الحصول على بيانات في الوقت الفعلي لتعزيز النماذج الأساسية بمزيد من المعلومات الحديثة عن العالم.

    تجني Reddit مئات الملايين من الدولارات من ترخيص مجموعة من المنتديات الفرعية والتعليقات الخاصة بها إلى Google لتدريب نماذجها. لدى Elon Musk's X ترتيب حصري مع شركته الأخرى، xAI، لمنح نماذجها إمكانية الوصول إلى محتوى الشبكة الاجتماعية للتدريب واسترجاع المعلومات الحالية. ومن المثير للسخرية أن نعتبر أن هذه الشركات تحرس بياناتها الخاصة عن كثب، ولكنها تعتقد بشكل أساسي أن المحتوى الذي يقدمه ناشرو الوسائط ليس له قيمة ويجب أن يكون مجانيًا.

    لن يكون مليون كتاب كافيًا لتلبية الاحتياجات التدريبية لأي شركة ذكاء اصطناعي، خاصة وأن هذه الكتب قديمة ولا تحتوي على معلومات حديثة، مثل اللغة العامية التي يستخدمها أطفال الجيل Z. ومن أجل تمييز نفسها عن المنافسين، سوف ترغب شركات الذكاء الاصطناعي في الاستمرار في الوصول إلى البيانات الأخرى – وخاصة النوع الحصري – بحيث لا تقوم جميعها بإنشاء نماذج متماثلة. يمكن لمجموعة بيانات مبادرة البيانات المؤسسية أن تقدم على الأقل بعض المساعدة لشركات الذكاء الاصطناعي التي تحاول تدريب نماذجها التأسيسية الأولية دون الوقوع في أي مشكلة قانونية.

    شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr البريد الإلكتروني
    السابقيتحدث الناس بالفعل عن شريحة Snapdragon الكبيرة التالية
    التالي تفاصيل جديدة حول لعبة Naughty Dog الجديدة Intergalactic

    المقالات ذات الصلة

    اخر الاخبار

    ترفع شركة Framework أسعار ذاكرة الوصول العشوائي للحواسيب المحمولة بنسبة 50% وسط أزمة مستمرة.

    14 ديسمبر, 2025
    اخر الاخبار

    يشمل التنافس بين “Mortal Kombat” و”Street Fighter” أفلامهما.

    14 ديسمبر, 2025
    اخر الاخبار

    يمكن الحصول على برامج “وورد” و”إكسل” و”باوربوينت” دون اشتراك حاليًا.

    14 ديسمبر, 2025
    اخر الاخبار

    فقد قطاع الرسوم المتحركة وألعاب الفيديو 3 ممثلين صوتيين هذا الأسبوع.

    14 ديسمبر, 2025
    اخر الاخبار

    تخفي منافذ USB في الشاشات قدرات خفية.

    13 ديسمبر, 2025
    اخر الاخبار

    فيلم ستيفن سبيلبرغ القادم يكشف عن ملصقه الترويجي.

    13 ديسمبر, 2025
    اخر الاخبار

    أدوات مفتوحة المصدر تعالج مشكلة انتفاخ نظام التشغيل Windows 11.

    13 ديسمبر, 2025
    اخر الاخبار

    “حرب النجوم” و”ديدبول” يقدمان هدايا احتفالية في ديزني لاند.

    13 ديسمبر, 2025
    اخر الاخبار

    آسوس تطرح Chromebook CM30 كجهازين في واحد بخصم 52%.

    13 ديسمبر, 2025
    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    Demo
    اخر الاخبار

    كيفية تسجيل مقاطع فيديو محمية بدون شاشة سوداء

    31 يوليو, 20241٬141 زيارة

    سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

    4 يوليو, 2024816 زيارة

    كل ما تريد معرفته عن Reacher الموسم الثالث

    6 مايو, 2024774 زيارة

    يحصل iPhone على أول تطبيق إباحي أصلي له

    4 فبراير, 2025751 زيارة

    Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

    2 أبريل, 2024721 زيارة

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    رائج الآن
    منوعات تقنية

    استخدم chatgpt بالعربي مجانا بدون تسجيل

    فريق التحرير29 مايو, 2025
    منوعات تقنية

    شات جي بي تي بدون تسجيل.. ChatGPT مجانا بالعربي

    فريق التحرير20 مايو, 2025
    اخر الاخبار

    هذا جهاز كمبيوتر ميني Ryzen 5 Mini مع ذاكرة وصول عشوائي 16 جيجابايت رخيصة بشكل مذهل: 190 دولارًا

    فريق التحرير16 مايو, 2025
    رائج الآن

    استخدم chatgpt بالعربي مجانا بدون تسجيل

    29 مايو, 202519 زيارة

    شات جي بي تي بدون تسجيل.. ChatGPT مجانا بالعربي

    20 مايو, 202512 زيارة

    هذا جهاز كمبيوتر ميني Ryzen 5 Mini مع ذاكرة وصول عشوائي 16 جيجابايت رخيصة بشكل مذهل: 190 دولارًا

    16 مايو, 202511 زيارة
    اختيارات المحرر

    ترفع شركة Framework أسعار ذاكرة الوصول العشوائي للحواسيب المحمولة بنسبة 50% وسط أزمة مستمرة.

    14 ديسمبر, 2025

    مُخترِع لعبة “Tomb Raider” يُعلّق على إعادة إنتاج (Remake) “Legacy of Atlantis”.

    14 ديسمبر, 2025

    شركة بيست باي تُقدم خصمًا بقيمة 250 دولارًا على طرز M4 MacBook Pro اليوم.

    14 ديسمبر, 2025

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    تقنية نيوز
    فيسبوك X (Twitter) الانستغرام يوتيوب لينكدإن تيكتوك
    • الرئيسية
    • سياسة الخصوصية
    • من نحن
    • اتصل بنا
    © 2025 تقنية نيوز. جميع حقوق النشر محفوظة.

    اكتب كلمة البحث ثم اضغط على زر Enter