تستكشف Microsoft ، المستثمر الرئيسي في Openai ، الآن ما إذا كانت الشركة الصينية Deepseek تستخدم أساليب شائكة لتدريب نماذج التفكير. وفقًا لقانون بلومبرج ، تعتقد الشركة الآن أن ديبسيك انتهكت شروط الخدمة الخاصة بها باستخدام واجهة برمجة التطبيقات (API) لتدريب نموذج R1 الذي تم الإعلان عنه مؤخرًا.
تأتي الأخبار لفترة طويلة بعد وقت طويل من قيام Crypto Czar ، David Sacks ، لـ Fox News في مقابلة يوم الثلاثاء بأنه “ممكن” Deepseek “سرق الملكية الفكرية من الولايات المتحدة”.
“هناك أدلة جوهرية على أن ما فعله ديبسيك هنا هو أنهم قاموا بتقطير المعرفة من نماذج Openai” ، قال Sacks the Outlet.
كانت صناعة الذكاء الاصطناعى تهتز حول قدرة Deepseek على تدريب نماذج الذكاء الاصطناعي بسرعة وفعالية من حيث التكلفة في عام واحد مع 5.6 مليون دولار فقط. هناك احتمال أساسي لسبب كفاءة الشركة هو أنها استخدمت نموذج شركة أخرى كخط أساسي.
ربما استخدم Deepseek عملية تسمى التقطير ، أيّ يستلزم نموذجين لهما ديناميكية للمعلم والطالب حتى يتمكن المرء من جمع المعلومات من الآخر. من ناحية ، قد يفسر هذا تكاليف التشغيل غير المكلفة للشركة واستخدام رقائق Nvidia H800 الأقل قوة. قد يكون Deepseek الآن على الخطاف لإثبات ما إذا كان الأمر يتخذ كل الإجراءات غير القانونية عند تطوير نماذجها.
قبل هذا التطور الأخير ، تكهن خبراء الصناعة سابقًا بأن Deepseek قد استخدم الهندسة العكسية على الأرجح لتدريب نماذجها. تحلل هذه العملية النماذج لتحديد أنماطها وتحيزاتها لتحسين النماذج المستقبلية. تعتبر الهندسة العكسية ممارسة شائعة بين مطوري المصدر المفتوح الذين يعتبرون قانونية.
لقد جمع الباحثون الأمنيون الذي تمت الموافقة عليه من قبل Microsoft معًا أن Deepseek ربما قامت بإخراج كمية كبيرة من التعليمات البرمجية من API Openai خلال خريف عام 2024. من المفترض أن تكون Microsoft على دراية Openai بالخرق في ذلك الوقت. تم الإعلان عن نموذج R1 الأسبوع الماضي ، مما لفت الانتباه إلى شركة الذكاء الاصطناعى الصينيين ، والأطراف المرتبطة بها.
تم الإشادة بـ Deepseek كتطبيق مفتوح المصدر AI ، والذي يمكن لأي شخص تطويره. هذا هو المكان الذي يأتي فيه الكثير من الإثارة المحيطة بالمنصة – بالإضافة إلى مقارنته بأدوات أفضل مثل ChatGPT و Google Gemini. Openai ليست خدمة مفتوحة المصدر. ومع ذلك ، يمكن لأي شخص الاشتراك للوصول إلى واجهة برمجة التطبيقات الخاصة به. أشارت شركة TechCrunch إلى أن الشركة توضح من شروط الخدمات التي لا يمكنها استخدام الكيانات الأخرى لتدريب نماذج الذكاء الاصطناعي الأخرى.
أخبر متحدث باسم Openai رويترز أنه بغض النظر عن اللوائح ، فإن العديد من الشركات الدولية التي تحاول نسخ النماذج من الشركات المعروفة في الولايات المتحدة أصبحت الآن أمرًا شائعًا.
“نحن ننخرط في تدابير مضادة لحماية عنوان IP الخاص بنا ، بما في ذلك عملية دقيقة يتم من خلالها إدراج القدرات الحدودية في النماذج التي تم إصدارها ، ونؤمن بأننا نتقدم إلى أنه من المهم للغاية أن نعمل عن كثب مع حكومة الولايات المتحدة لحماية أفضل وقال المتحدث باسم أكثر النماذج من الجهود التي بذلها الخصوم والمنافسين لاتخاذ التكنولوجيا الأمريكية.