بدأت خدمة جوجل للكتب بفهرسة الكتب المنخفضة الجودة، مما قد يؤثر في كيفية عمل أداة تتبع اللغة Ngram.
وتعد خدمة الكتب من عملاقة البحث بمنزلة خدمة تفهرس المواد المنشورة، وأصبحت هذه الخدمة ضرورية للأكاديميين.
وتشير التقارير إلى أن خدمة الكتب من جوجل تضمنت العديد من الكتب التي يبدو أن الذكاء الاصطناعي كتبها.
وبحث التقرير في خدمة جوجل للكتب باستخدام المصطلح “منذ آخر تحديث لمعلوماتي”، وهي عبارة شائعة تستخدمها روبوتات الدردشة بالذكاء الاصطناعي، مثل ChatGPT، لإعلامك بأن لديها قيود زمنية على المعلومات التي يمكنها الوصول إليها.
ويمكنك البحث في خدمة الكتب من عملاقة البحث عن جمل أو مصطلحات محددة، وعادةً ما تعرض الخدمة الأعمال المكتوبة المحتوية تلك العبارات.
ووجد التقرير أن معظم الكتب في الصفحات القليلة الأولى من البحث كانت أعمالًا عن الذكاء الاصطناعي، مع أنه ظهرت بين تلك النتائج كتب لا تتحدث عن التكنولوجيا ويبدو أن الذكاء الاصطناعي كتبها.
وقال التقرير إن الكتب التي عثر عليها تبدو أقرب إلى مدخلات ويكيبيديا، وتضمنت الجملة “منذ آخر تحديث لمعلوماتي”.
كما أن هذه الكتب المكتوبة بالذكاء الاصطناعي معروضة للبيع عبر موقع أمازون وفي متاجر التجزئة الأخرى.
وتحتوي الكتب الأخرى التي تتناول موضوعات مثل تويتر معلومات تعود إلى عام 2021، عندما حصلت بعض نماذج الذكاء الاصطناعي على بيانات التدريب آخر مرة.
وتمثل خدمة كتب جوجل معظم البيانات التي تدعم Ngram، وهي أداة بحث تتتبع كيفية تغير اللغة بمرور الوقت. وتأخذ Ngram المعلومات من الأعمال المكتوبة لإظهار كيفية تطور استخدام اللغة.
ومسحت خدمة جوجل للكتب الأعمال المكتوبة التي يعود تاريخها إلى القرن السادس عشر وفهرستها، وحدثت Ngram البيانات التي تستشهد بها آخر مرة في عام 2019.
ولا تعد أداة Ngram مثالية، مع أن العديد من اللغويين والأكاديميين الآخرين يستخدمونها لجمع الأبحاث.
وأشارت جوجل إلى أن الأعمال الأخيرة ضمن خدمتها للكتب لا تظهر في نتائج Ngram، مع أنه من الممكن أن تضمن في تحديثات البيانات المستقبلية.
وقالت الشركة إنها تواصل تقييم نهجها مع تطور عالم نشر الكتب، دون أن تذكر إزالة هذه النتائج من الخدمة.