أعلنت Google عبر منشور على X (Twitter سابقًا) يوم الأربعاء أن SynthID متاح الآن لأي شخص يريد تجربته. يقوم نظام المصادقة للمحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي بتضمين علامات مائية غير محسوسة في الصور ومقاطع الفيديو والنصوص التي تم إنشاؤها، مما يمكّن المستخدمين من التحقق مما إذا كان جزء من المحتوى قد تم إنشاؤه بواسطة البشر أو الآلات.
وكتبت الشركة: “نحن نفتح المصدر لأداة وضع العلامات المائية الخاصة بنصوص SynthID الخاصة بنا”. “إنه متاح مجانًا للمطورين والشركات، وسيساعدهم في تحديد المحتوى الذي ينشئه الذكاء الاصطناعي.”
ظهر SynthID لأول مرة في عام 2023 كوسيلة لوضع علامة مائية على الصور والصوت والفيديو التي تم إنشاؤها بواسطة الذكاء الاصطناعي. تم دمجه في البداية في Imagen، وأعلنت الشركة لاحقًا عن دمجها في برنامج Gemini chatbot في مايو الماضي في I/O 2024.
يعمل النظام عن طريق تشفير الرموز المميزة – تلك هي الأجزاء الأساسية من البيانات (سواء كانت حرفًا واحدًا أو كلمة أو جزءًا من عبارة) التي يستخدمها الذكاء الاصطناعي التوليدي لفهم الموجه والتنبؤ بالكلمة التالية في رده – مع علامات مائية غير محسوسة أثناء عملية إنشاء النص. وهي تفعل ذلك، وفقًا لمدونة DeepMind في شهر مايو، من خلال “تقديم معلومات إضافية في توزيع الرموز المميزة عند نقطة الإنشاء عن طريق تعديل احتمالية إنشاء الرموز المميزة”.
من خلال مقارنة اختيارات الكلمات للنموذج إلى جانب “درجات الاحتمالية المعدلة” مقابل النمط المتوقع من الدرجات للنص الذي يحمل علامة مائية وغير علامة مائية، يمكن لـ SynthID اكتشاف ما إذا كان الذكاء الاصطناعي قد كتب تلك الجملة.
وإليك كيفية قيام SynthID بوضع العلامات المائية على المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي عبر الأساليب. ↓ pic.twitter.com/CVxgP3bnt2
— جوجل ديب مايند (@GoogleDeepMind) 23 أكتوبر 2024
ولا تؤثر هذه العملية على دقة الاستجابة أو جودتها أو سرعتها، وفقا لدراسة نشرت في طبيعة يوم الأربعاء، ولا يمكن تجاوزه بسهولة. على عكس البيانات الوصفية القياسية، التي يمكن تجريدها ومسحها بسهولة، يقال إن العلامة المائية لـ SynthID تظل حتى لو تم اقتصاص المحتوى أو تحريره أو تعديله بأي شكل آخر.
“يعد تحقيق علامة مائية موثوقة وغير محسوسة للنص الذي تم إنشاؤه باستخدام الذكاء الاصطناعي تحديًا أساسيًا، خاصة في السيناريوهات التي تكون فيها مخرجات (نموذج اللغة الكبيرة) قريبة من الحتمية، مثل الأسئلة الواقعية أو مهام إنشاء التعليمات البرمجية”، كما يقول سهيل فيزي، الأستاذ المشارك في جامعة ميريلاند. قال مراجعة تكنولوجيا معهد ماساتشوستس للتكنولوجيا، مشيرًا إلى أن طبيعتها مفتوحة المصدر “تسمح للمجتمع باختبار هذه الكاشفات وتقييم قوتها في بيئات مختلفة، مما يساعد على فهم القيود المفروضة على هذه التقنيات بشكل أفضل.”
ومع ذلك، فإن النظام ليس مضمونًا. على الرغم من أنه مقاوم للتلاعب، إلا أنه يمكن إزالة العلامات المائية الخاصة بـ SynthID إذا تم تشغيل النص من خلال تطبيق ترجمة لغة أو إذا تمت إعادة كتابته بشكل كبير. كما أنها أقل فعالية مع المقاطع القصيرة من النص وفي تحديد ما إذا كان الرد بناءً على بيان واقعي قد تم إنشاؤه بواسطة الذكاء الاصطناعي. على سبيل المثال، هناك إجابة واحدة صحيحة للسؤال “ما هي عاصمة فرنسا؟” وسيخبرك كل من البشر والذكاء الاصطناعي أنها باريس.
إذا كنت ترغب في تجربة SynthID بنفسك، فيمكنك تنزيله من Hugging Face كجزء من مجموعة أدوات Responsible GenAI Toolkit المحدثة من Google.