وبحسب تقرير مدمر من 404 Media، مدعوم بمحادثات Slack داخلية ورسائل بريد إلكتروني ووثائق حصلت عليها المنفذ، ساعدت Nvidia نفسها على “تجربة بصرية مدى الحياة البشرية من خلال بيانات تدريب يوميًا”، كما اعترف Ming-Yu Liu، نائب رئيس الأبحاث في Nvidia وقائد مشروع Cosmos، في بريد إلكتروني في شهر مايو.
وقال موظفون سابقون في شركة إنفيديا لم يتم ذكر أسمائهم لموقع 404 إنه طُلب منهم استخراج محتوى فيديو من Netflix وYouTube ومصادر أخرى عبر الإنترنت من أجل الحصول على بيانات تدريب لاستخدامها مع منتجات الذكاء الاصطناعي المختلفة للشركة. وتشمل هذه المنتجات مولد العالم ثلاثي الأبعاد Omniverse من إنفيديا، وأنظمة السيارات ذاتية القيادة، و”الإنسان الرقمي”.
وعندما سأل هؤلاء الموظفون عن شرعية المشروع، المسمى داخليًا باسم كوزموس، أكدت لهم الإدارة أنهم حصلوا على موافقة من أعلى المستويات في الشركة لاستخدام هذا المحتوى.
احصل على تحليلك الأسبوعي للتكنولوجيا وراء ألعاب الكمبيوتر
سعى المشروع إلى بناء نموذج أساسي، يشبه Gemini 1.5 أو GPT-4 أو Llama 3.1، “يجمع محاكاة النقل الخفيف والفيزياء والذكاء في مكان واحد لفتح العديد من التطبيقات اللاحقة المهمة لشركة Nvidia.”
وللقيام بذلك، يُزعم أن مشروع Cosmos استخدم برنامج تنزيل فيديو مفتوح المصدر واستخدم التعلم الآلي للانتقال بين عناوين IP، وبالتالي تجنب محاولات YouTube لحظره. ووفقًا لرسائل البريد الإلكتروني التي اطلع عليها 404، ناقش مديرو المشروع استخدام ما يصل إلى 30 جهازًا افتراضيًا يعمل على Amazon Web Services لتنزيل مقاطع فيديو كاملة الطول ومقاطع فيديو بطول 80 عامًا كل يوم.
من جانبها، تدعي شركة إنفيديا عدم ارتكاب أي مخالفات. وقال متحدث باسم الشركة لـ 404 Media عبر البريد الإلكتروني: “نحن نحترم حقوق جميع منشئي المحتوى ونثق في أن نماذجنا وجهودنا البحثية متوافقة تمامًا مع نص وروح قانون حقوق النشر”. “يحمي قانون حقوق النشر تعبيرات معينة ولكن ليس الحقائق أو الأفكار أو البيانات أو المعلومات. يحق لأي شخص معرفة الحقائق أو الأفكار أو البيانات أو المعلومات من مصدر آخر واستخدامها لصنع تعبيراته الخاصة. يحمي الاستخدام العادل أيضًا القدرة على استخدام العمل لغرض تحويلي، مثل تدريب النماذج”.
وهذه ليست المرة الأولى التي تتبنى فيها شركة إنفيديا (ناهيك عن الغالبية العظمى من الشركات الأخرى في مجال الذكاء الاصطناعي) نهج “الاستخلاص أولاً ثم طلب المغفرة لاحقًا” في جهودها التدريبية في مجال الذكاء الاصطناعي. ففي يوليو/تموز، ورد اسم إنفيديا في تقرير آخر عن الاستخلاص غير القانوني لمقاطع الفيديو المحمية بحقوق الطبع والنشر إلى جانب أنثروبيك وسيلزفورس.
في معرض CES 2024، أثارت الشركة عاصفة من الجدل على الإنترنت بإجاباتها الغامضة حول كيفية تدريب محرك الذكاء الاصطناعي الجديد للألعاب. وردًا على ذلك، أكدت Nvidia أن أدواتها “آمنة تجاريًا”.