تقوم Reddit بحظر آلة Wayback Archive الخاصة بالإنترنت من فهرسة معظم موقعها ، بعد اكتشاف أن شركات الذكاء الاصطناعى كانت تقوم بتجميع بياناتها من كبسولة الوقت الرقمي.
وتأتي هذه الخطوة في الوقت الذي يشدد فيه Reddit قبضته على بيانات المستخدم. لا تمانع الشركة في تدريب شركات AI على نماذجها على مشاركات Reddit ، ولكن عليها أن تدفع أولاً. قال رديت سابقًا إنه لن يقيد “ممثلين حسن النية” مثل أرشيف الإنترنت ، ولكنه يعتقد الآن أن البعض يساعدون شركات الذكاء الاصطناعى في التخلص من رسوم الترخيص. يسلط التغيير المفاجئ لـ Reddit إلى تسليط الضوء على كيف أصبح ترخيص البيانات مصدرًا رئيسيًا للإيرادات في عصر الذكاء الاصطناعي.
أرشيف الإنترنت هو منظمة غير ربحية مكرسة لبناء مكتبة رقمية شاسعة من مواقع الويب وغيرها من المحتوى عبر الإنترنت. حتى الآن ، قامت برؤوس مليارات من صفحات الويب ، إلى جانب ملايين الكتب ومقاطع الفيديو وبرامج البرامج. تتيح أداة التوقيع الخاصة بها ، جهاز Wayback ، للمستخدمين حفظ لقطات من صفحات الويب وإعادة النظر فيها لاحقًا لمعرفة كيفية نظرهم إلى تاريخ محدد بالضبط.
يقول Reddit إن لديها دليل على أن بعض شركات الذكاء الاصطناعى تستغل آلة Wayback لتجاوز سياساتها وتكشفي محتوى المستخدم دون إذن.
وقال متحدث باسم Reddit لـ Gizmodo في بيان عبر البريد الإلكتروني: “يوفر أرشيف الإنترنت خدمة لشبكة الويب المفتوحة ، لكننا تم إطلاعنا على الحالات التي تنتهك فيها شركات الذكاء الاصطناعي سياسات المنصة ، بما في ذلك سياساتنا ، وكشط البيانات من آلة Wayback”. “حتى يتمكنوا من الدفاع عن موقعهم والامتثال لسياسات النظام الأساسي (على سبيل المثال ، فيما يتعلق بخصوصية المستخدم ، إعادة: حذف المحتوى الذي تمت إزالته) ، نحن نحد بعض وصولهم إلى بيانات Reddit لحماية Redditors.”
أخبر Reddit The Verge أن آلة Wayback لن تكون قادرة على الزحف بعد الآن صفحات نشر أو تعليقات أو ملفات تعريف. بدلاً من ذلك ، لن يُسمح إلا بفهرسة الصفحة الرئيسية لـ Reddit. تبدأ القيود “ترشيح” اليوم ، ويقول Reddit إنه أعطى أرشيف الإنترنت رؤوسًا مسبقًا.
لم يرد أرشيف الإنترنت على الفور على طلب للتعليق من Gizmodo.
قامت Reddit بتشديد السيطرة على الوصول إلى بياناتها في السنوات الأخيرة. على الرغم من أن الشركة مفتوحة لترخيص بياناتها ، فإنها تنقسم على الشركات التي لم تدفع. لقد نجحت الشركة بالفعل في صفقات بملايين الدولارات مع Google و Openai. في Google Deal ، دخلت Reddit مع Google للحصول على كل من فهرسة البحث وبيانات تدريب الذكاء الاصطناعى ، ثم بدأت في منع محركات البحث الأخرى من تصوير مشاركات Reddit الأخيرة في نتائج البحث.
في يونيو ، رفع رديت دعوى قضائية ضد منظمة العفو الدولية لبدء التشغيل الأنثروبري ، متهمة به من الكشط غير المصرح به.