يأخذ Reddit أنثروبور إلى المحكمة ، متهمة شركة الذكاء الاصطناعي بسحب محتوى المستخدم من النظام الأساسي دون إذن واستخدامه لتدريب طرز Claude AI. الدعوى ، التي تم رفعها في محكمة ولاية كاليفورنيا ، تدعي أن الأنثروبور قدمت أكثر من 100000 طلب غير مصرح به لخوادم رديت ، حتى بعد أن قلت علنا أنها توقفت.
تم بناء القضية حول ادعاء Reddit بأن الأنثروبور تجاهل كل من القيود الفنية وشروط الخدمة الخاصة بها. وفقًا للشكوى ، تم تجاوز الحماية المتجددة مثل ملف Robots.txt الخاص بالموقع ، والذي من المفترض أن يمنع الكشط الآلي. يتهم Reddit أيضًا بشهر إنثروبور بانتهاك خصوصية المستخدم من خلال جمع المنشورات الشخصية واستخدامها – بما في ذلك المحتوى المحذوف – لأغراض تجارية.
تقول Reddit إنها توفر وصولًا منظمًا إلى بياناتها من خلال اتفاقيات الترخيص مع شركات مثل Openai و Google. تتضمن هذه الصفقات شروطًا حول استخدام المحتوى ، وحماية الخصوصية ، وحذف البيانات. وفقًا للمنصة ، رفضت الأنثروبور متابعة اتفاقية رسمية وبدلاً من ذلك قام بتخليص الموقع مباشرة ، وتجنب رسوم الترخيص وتخطي حماية المستخدم في هذه العملية.
تسلط الدعوى الضوء على ورقة بحثية 2021 شارك في تأليفها الرئيس التنفيذي لشركة أنثروبور داريو آمودي ، والتي أشارت إلى رديت كمصدر غني لبيانات التدريب لنماذج اللغة. تضمنت Reddit أيضًا أمثلة حيث بدا أن كلود لإعادة إنتاج مشاركات Reddit تقريبًا للكلمة ، حتى مرددًا المنشورات التي تم حذفها من قبل المستخدمين. وتقول الشركة إن الشركة تظهر فشلت في وضع الدرابزين في مكانها لاحترام خصوصية المستخدم أو عمليات إزالة المحتوى.
تسعى Reddit إلى الحصول على أضرار مالية وأمر المحكمة من شأنه أن يمنع الأنثروبور من استخدام محتوى Reddit في الإصدارات المستقبلية من نماذجها.
لقد استجاب الأنثروبور ، مدعيا أنها لا توافق على المطالبات وخطط للدفاع عن نفسها. ومع ذلك ، فإن هذه ليست المرة الأولى التي تتعرض فيها الشركة لضغوط قانونية حول كيفية جمع بيانات التدريب.
في أغسطس 2024 ، رفعت مجموعة من المؤلفين دعوى جماعية تتهم أنثروبور باستخدام عملهم المحمي بحقوق الطبع والنشر دون إذن. ادعوا أن الشركة دربت نماذجها على الكتب والمواد المكتوبة الأخرى دون موافقتها ، ثم طلبت تعويضًا لاستخدام محتوىها.
شملت قضية مماثلة من أكتوبر 2023 مجموعة الموسيقى العالمية وغيرها من الناشرين. رفعوا دعوى ضد الأنثروبور على الادعاءات بأن كلود chatbot كان يعيد إنتاج كلمات الأغاني المحمية بحقوق الطبع والنشر. جادل شركات الموسيقى بأن هذا الاستخدام انتهك حقوق الملكية الفكرية وطلبت من المحكمة منع مزيد من استخدام كلماتها.
على عكس تلك الدعاوى القضائية ، لا تركز قضية Reddit على حقوق الطبع والنشر. بدلاً من ذلك ، يركز على خرق العقد والمنافسة غير العادلة. حجة Reddit هي أن البيانات المأخوذة من موقعها ليست علنية فقط – إنها تحكمها المصطلحات التي تجاهلها الأنثروبور عن قصد. قد يجعل هذا التمييز الحالة مهمة للمنصات الأخرى التي تستضيف محتوى المستخدم ولكنها ترغب في التحكم في كيفية استخدامها في أنظمة الذكاء الاصطناعى التجارية.
يتهم رديت أيضا أنثروبور في تضليل الجمهور. تشير الدعوى إلى البيانات العامة من أنثروبور المطالبة بأنها تحترم قواعد الكشط والقيم خصوصية المستخدم ، والتي يقول رديت إنها تتناقض مع تصرفات الشركة.
“من جانبها ، على الرغم من ما تقوله موادها التسويقية ، فإن الأنثروبور لا تهتم بقواعد رديت أو مستخدمي رديت” ، كما تقول الدعوى. “إنها تعتقد أنه يحق لها أن تأخذ أي محتوى يريده ويستخدم هذا المحتوى ولكنه يرغب ، مع الإفلات من العقاب”.
بعد رفع الدعوى ، ارتفع سهم Reddit ما يقرب من 67 ٪ ، وهي علامة على أن المستثمرين دعموا هذه الخطوة. يمكن أن تحدد نتيجة القضية سابقة لكيفية قيام الشركات بتوازن بين محتوى الإنترنت المفتوح وحقوق المستخدمين ومالكي المحتوى.
نظرًا لأن المزيد من شركات الذكاء الاصطناعى تعتمد على كميات كبيرة من البيانات عبر الإنترنت ، فإن الأسئلة القانونية والأخلاقية حول تجاهل التجاهل تزداد صعوبة في تجاهلها. تضيف قضية Reddit إلى القائمة المتنامية من الدعاوى القضائية التي تشكل كيف تتكشف هذه الموجة التالية من تطوير الذكاء الاصطناعي.
(تصوير بريت جوردان)
انظر أيضًا: الأخلاق في الأتمتة: معالجة التحيز والامتثال في الذكاء الاصطناعي
هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الكبيرة من قادة الصناعة؟ تحقق من AI و Big Data Expo الذي يقام في أمستردام ، كاليفورنيا ، ولندن. تم تحديد الحدث الشامل مع الأحداث الرائدة الأخرى بما في ذلك مؤتمر الأتمتة الذكي ، و blockx ، وأسبوع التحول الرقمي ، ومعرض Cyber Security & Cloud.
استكشاف أحداث وندوات الويب القادمة الأخرى التي تعمل بها TechForge هنا.