أعلنت جوجل إضافة دعم لما يصل إلى 110 لغات جديدة إلى خدمة الترجمة التي كانت تدعم في السابق مقدار 133 لغة.
ويعد هذا التوسع قفزة كبيرة، إذ أصبحت خدمة الترجمة تدعم الآن ما يصل إلى 243 لغة. وساعد نموذج الذكاء الاصطناعي PaLM 2 خدمة الترجمة في تعلم هذه اللغات الجديدة.
وكان نموذج الذكاء الاصطناعي PaLM 2 جيدًا في تعلم اللغات المرتبطة ببعضها بعضًا، مثل اللغات القريبة من الهندية، مثل العوضي والمروادي، والكريول الفرنسية، مثل الكريولية السيشيلية والكريول الموريشيوسية، كما يقول إسحاق كاسويل مهندس البرمجيات من جوجل.
وتتضمن قائمة اللغات المدعومة حديثًا في خدمة الترجمة الكانتونية التي كانت منذ مدة طويلة واحدة من اللغات المطلوبة لخدمة الترجمة من جوجل، كما يقول كاسويل.
وقال كاسويل: “نظرًا إلى أن اللغة الكانتونية غالبًا ما تتداخل مع لغة الماندرين في الكتابة، فإنه من الصعب العثور على البيانات ونماذج التدريب”، وتأتي نحو ربع اللغات الجديدة من أفريقيا.
وتشمل هذه اللغات العفرية والكانتونية والمانكسية والنكو والبنجابية (الشاهموخية) والأمازيغية (الأمازيغية) والتوك بيسين.
وقالت الشركة إن اللغات المضافة حديثًا تمثل أكثر من 614 مليون ناطق أو ما يقرب من 8 في المئة من سكان العالم.
ولاحظت جوجل أن هذه اللغات في مراحل مختلفة من الاستخدام. ولدى البعض من هذه اللغات نحو 100 مليون متحدث، في حين أن بعض هذه اللغات ليس لديها أي متحدث نشط، ويحاول الناس الحفاظ على تلك اللغات.
وتشمل اللغات الجديدة تلك التي تتحدث بها المجتمعات الصغيرة من السكان الأصليين بالإضافة إلى الأسماء الشائعة، وهناك لغات تحاول جوجل الحفاظ عليها، مثل لغة مانكس، التي كادت أن تنقرض عندما توفي آخر متحدث أصلي لها في عام 1974.
وقالت جوجل إنها تأخذ في الحسبان عناصر، مثل الأصناف واللهجات الإقليمية ومعايير التهجئة المختلفة، أثناء إضافة الدعم للغة.
وقال كاسويل: “يعتمد نهجنا على إعطاء الأولوية للأصناف الأكثر استخدامًا في كل لغة. على سبيل المثال، لغة الغجر هي لغة لها العديد من اللهجات في جميع أنحاء أوروبا”.
وتعد إضافة مقدار 110 لغة إلى خدمة الترجمة من جوجل جزءًا من مبادرتها لدعم مقدار 1000 لغة من خلال الذكاء الاصطناعي، وهي مبادرة أعلنتها الشركة في عام 2022.
وفي العام نفسه، أضافت الشركة دعمًا لمقدار 24 لغة يتحدث بها أكثر من 300 مليون شخص من خلال تقنية تسمى Zero-Shot Machine Translation.