تم تقديم ChatGPT قبل سبعة أسابيع فقط ، لكن الذكاء الاصطناعي قد اكتسب بالفعل ضجة طوال العمر. لا يخمن أي شخص ما إذا كانت هذه التكنولوجيا المعينة تفتح كيمونو AI للأبد أم أنها مجرد لمحة قبل حلول فصل الشتاء القادم للذكاء الاصطناعي ، ولكن هناك شيء واحد مؤكد: إنها أطلقت محادثة مهمة حول الذكاء الاصطناعي ، بما في ذلك مستوى الشفافية الذي يجب أن نتوقعه عند العمل مع الذكاء الاصطناعي وكيفية معرفة وقت الكذب.
منذ إطلاقه في 30 نوفمبر ، أظهر أحدث نموذج لغوي لـ OpenAI ، والذي تم تدريبه على مجموعة كبيرة جدًا من المعرفة البشرية ، قدرة خارقة لتوليد استجابات مقنعة للمطالبات المستندة إلى النص. إنه لا يقتصر على موسيقى الراب مثل Snoop Dogg والقوافي مثل Nick Cave (إلى استياء كاتب الأغاني الكبير) ، ولكنه أيضًا يحل المشكلات الرياضية المعقدة ويكتب رموز الكمبيوتر.
الآن بعد أن أصبح بإمكان ChatGPT كتابة كتابة متواضعة وصحيحة (في الغالب) ، فقد تم الإعلان رسميًا عن انتهاء عصر مقال الطالب. كتب ستيفن ماركي في كتابه “The College Essay Is Dead” الذي نُشر الشهر الماضي: “لا أحد مستعدًا لكيفية قيام الذكاء الاصطناعي بتحويل الأوساط الأكاديمية”. يكتب ماركي: “بالاستناد إلى تجربتي كأستاذ سابق في شكسبير ، أعتقد أن الأوساط الأكاديمية ستستغرق 10 سنوات لمواجهة هذا الواقع الجديد: سنتان حتى يكتشف الطلاب التكنولوجيا ، وثلاث سنوات أخرى لكي يدرك الأساتذة أن الطلاب يستخدمون التكنولوجيا ، ثم خمس سنوات لمديري الجامعات ليقرروا ما يفعلونه حيال ذلك ، إن وجد. يعد المعلمون بالفعل من أكثر الأشخاص المرهقين في العمل والذين يتقاضون رواتب منخفضة في العالم. إنهم يتعاملون بالفعل مع العلوم الإنسانية في أزمة. والآن هذا. أشعر بهم “.
من المحتمل أن ماركي كان بعيدًا قليلاً في توقيته. بالنسبة للمبتدئين ، بدأت المدارس بالفعل في الاستجابة لتهديد الانتحال الذي تشكله ChatGPT ، مع فرض حظر في مناطق المدارس العامة في سياتل وواشنطن ومدينة نيويورك. وبفضل نفس المسيرة الحثيثة للتكنولوجيا التي منحتنا ChatGPT ، نكتسب القدرة على اكتشاف متى يتم استخدام الذكاء الاصطناعي التوليدي.
خلال عطلة نهاية الأسبوع ، بدأت الأخبار تتسرب إلى الخارج حول أداة يمكنها اكتشاف وقت استخدام ChatGPT لإنشاء جزء معين من النص. الأداة التي أطلق عليها اسم GPTZero ، كتبها إدوارد تيان ، وهو متخصص في علوم الكمبيوتر في جامعة برينستون في نيوجيرسي.
تيان كتب على تويتر. “(T) الدافع هنا هو زيادة سرقة الذكاء الاصطناعي. (T) hink هل سيريد معلمو المدارس الثانوية من الطلاب الذين يستخدمون ChatGPT كتابة مقالات التاريخ الخاصة بهم؟ (L) على الأرجح لا. “
تعمل الأداة من خلال تحليل خاصيتين للنص: مستوى “الحيرة” ومستوى “الاندفاع” ، وفقًا لمقال على NPR. قرر Tian أن ChatGPT يميل إلى إنشاء نص بمستوى أقل من التعقيد من النص الذي تم إنشاؤه بواسطة الإنسان. كما وجد أن ChatGPT يولد باستمرار جملًا تكون أكثر اتساقًا في الطول وأقل “انفجارًا” من البشر.
GPTZero ليست مثالية (لا يوجد ذكاء اصطناعي) ، ولكن في المظاهرات ، يبدو أنها تعمل. يوم الأحد ، أعلن تيان على ظرفه الفرعي أنه يجري محادثات مع مجالس المدارس وصناديق المنح الدراسية لتقديم نسخة جديدة من الأداة ، تسمى GPTZeroX ، إلى 300 ألف مدرسة ومنح دراسية. يكتب “إذا كانت منظمتك مهتمة ، فيرجى إخبارنا بذلك”.
تعقب الهلوسة
وفي الوقت نفسه ، يقوم مطورون آخرون ببناء أدوات إضافية للمساعدة في حل مشكلة أخرى ظهرت للضوء مع صعود ChatGPT إلى الشهرة: الهلوسة.
يقول بيتر ريلان ، المؤسس المشارك ورئيس مجلس إدارة Got It AI ، وهي شركة في Silicon Valley التي تطور محادثة مخصصة حلول الذكاء الاصطناعي للعملاء.
الإنترنت مليء بأمثلة على ChatGPT تخرج عن المسار. سيعطيك النموذج نصًا مكتوبًا – وخاطئًا – بشكل رائع حول السجل الخاص به يمشي عبر القناة الإنجليزية سيرًا على الأقدام ، أو ستكتب مقالًا مقنعًا عن السبب المايونيز بهار عنصري، إذا طُلب منك ذلك بشكل صحيح.
يقول ريلان ، بشكل تقريبي ، إن معدل الهلوسة في ChatGPT يتراوح بين 15٪ و 20٪. يقول: “إذن ، 80٪ من الوقت ، يعمل بشكل جيد ، و 20٪ من الوقت ، يتكون من أشياء” داتانامي. “المفتاح هنا هو معرفة متى يكون (هلوسة) ، والتأكد من أن لديك إجابة بديلة أو استجابة تقدمها للمستخدم ، مقابل هلوسته.”
أعلنت Got It AI الأسبوع الماضي عن معاينة خاصة لمكون جديد للتحقق من الحقيقة في Autonomous Articlebot ، أحد منتجين في الشركة. مثل ChatGPT ، يعتمد مدقق الحقيقة التابع للشركة أيضًا على نموذج لغة كبير تم تدريبه لاكتشاف ما إذا كان ChatGPT (أو نماذج اللغات الكبيرة الأخرى) يخبرنا عن أكذوبة.
مدقق الحقيقة الجديد دقيق بنسبة 90٪ في الوقت الحالي ، حسب ريلان. لذلك إذا تم استخدام ChatGPT أو نموذج لغة كبير آخر لتوليد استجابة 100 مرة وكان 20 منها خاطئًا ، فسيكون مدقق الحقيقة قادرًا على اكتشاف 18 من هذه الافتراءات قبل إرسال الإجابة إلى المستخدم. يقول ريلان إن هذا يزيد بشكل فعال معدل دقة ChatGPT إلى 98٪.
“أنت الآن في نطاق مقبول. نحن نصوّر 95٪ بعد ذلك “. “إذا تمكنت من اكتشاف 95٪ من هذه الهلوسة ، فإن إجابة واحدة من كل 100 لا تزال غير دقيقة. أنت الآن في نظام حقيقي من فئة المؤسسات “.
لم تقم شركة OpenAI ، الشركة المصنعة لـ ChatGPT ، بإصدار واجهة برمجة تطبيقات لنموذج اللغة الكبير الذي جذب انتباه العالم. ومع ذلك ، من المعروف أن النموذج الأساسي الذي تستخدمه ChatGPT هو GPT-3 ، والذي يحتوي على واجهة برمجة تطبيقات متاحة. يمكن الآن استخدام مدقق الحقيقة الخاص بـ Got It AI مع الإصدار الأخير من GPT-3 ، الذي يطلق عليه اسم davinci-003 ، والذي تم إصداره في 28 نوفمبر.
يقول ريلان: “أقرب نموذج وجدنا في API هو GPT-3 davinci”. “هذا ما نعتقد أنه قريب مما تستخدمه ChatGPT خلف الكواليس.”
يقول ريلان إن مشكلة الهلوسة لن تختفي تمامًا مع أنظمة الذكاء الاصطناعي للمحادثة ، ولكن يمكن التقليل منها ، وتحقق OpenAI تقدمًا على هذا الصعيد. على سبيل المثال ، يقترب معدل الخطأ لـ GPT-3.5 من 30٪ ، لذا فإن معدل 20٪ مع ChatGPT – والذي ينسبه Relan إلى تبني OpenAI لحلقة التغذية المرتدة البشرية (RLHF) المعززة – يعد بالفعل تحسنًا كبيرًا.
يقول ريلان: “أعتقد حقًا أن أوبن إيه آي … سوف يحل بعض نزعة المنصة الأساسية إلى الهلوسة”. “لكنه نموذج عشوائي. ستقوم بمطابقة الأنماط والتوصل إلى شيء ما ، وفي بعض الأحيان ستشكل الأشياء. هذا ليس تحدينا. هذا هو التحدي الذي يواجه OpenAI: كيفية تقليل معدل الهلوسة من 20٪ إلى 10٪ إلى 5٪ إلى القليل جدًا بمرور الوقت “.
(ملاحظة المحرر: هذا المقال بالاشتراك مع Datanami)