على الرغم من أن الذكاء الاصطناعي قد يشعر في كل مكان ، إلا أنه يعمل بشكل أساسي في جزء صغير من اللغات البالغة 7000 في العالم ، مما يترك جزءًا كبيرًا من سكان العالم وراءهم. تهدف Nvidia إلى إصلاح هذه البقعة العمياء الصارخة ، وخاصة داخل أوروبا.
أصدرت الشركة للتو مجموعة جديدة قوية من أدوات مفتوحة المصدر تهدف إلى منح المطورين القدرة على بناء منظمة العفو الدولية عالية الجودة لـ 25 لغة أوروبية مختلفة. ويشمل ذلك لغات رئيسية ، ولكن الأهم من ذلك ، أنه يوفر شريان الحياة لأولئك الذين غالباً ما يتم تجاهله من قبل التكنولوجيا الكبيرة ، مثل الكرواتية والإستونية والمالطية.
الهدف من ذلك هو السماح للمطورين بإنشاء نوع من الأدوات التي تعمل بالطاقة الصوتية التي يعتبرها الكثيرون منا أمراً مفروغاً منه ، من مجموعات الدردشة متعددة اللغات التي تفهمك فعليًا إلى روبوتات خدمة العملاء وخدمات الترجمة التي تعمل في وميض العين.
محور هذه المبادرة صومعة، مكتبة هائلة من الكلام البشري. أنه يحتوي على حوالي مليون ساعة من الصوت ، وكلها برعاية للمساعدة في تعليم الذكاء الاصطناعي الفروق الدقيقة في التعرف على الكلام وترجمة.
للاستفادة من بيانات الكلام هذه ، توفر NVIDIA أيضًا نماذج جديدة من الذكاء الاصطناعى المصممة لمهام اللغة:
- Canary-1B-V2، نموذج كبير تم تصميمه لدقة عالية على وظائف النسخ والترجمة المعقدة.
- الببركة-TDT-0.6B-V3، وهو مصمم للتطبيقات في الوقت الفعلي حيث تكون السرعة كل شيء.
إذا كنت حريصًا على الغوص في العلم الذي يقف وراءه ، فسيتم تقديم الورقة على Granary في مؤتمر Interspeech في هولندا هذا الشهر. للمطورين الذين يتوقون إلى الحصول على أيديهم ، تتوفر مجموعة البيانات وكلا النموذجين بالفعل على وجه المعانقة.
السحر الحقيقي ، ومع ذلك ، يكمن في كيفية إنشاء هذه البيانات. نعلم جميعًا أن تدريب الذكاء الاصطناعى يتطلب كميات هائلة من البيانات ، ولكن الحصول عليها عادة ما يكون عملية بطيئة ومكلفة ومملة بصراحة للتعليقات التعليمية البشرية.
للتغلب على هذا ، قام فريق NVIDIA's Speech AI – الذي يعمل مع باحثين من جامعة كارنيجي ميلون وفونديزيون برونو كيسلر – ببناء خط أنابيب آلي. باستخدام مجموعة أدوات NEMO الخاصة بهم ، تمكنوا من أخذ الصوت الخام وغير المسموح به وينزعها إلى بيانات منظمة عالية الجودة يمكن أن تتعلمها منظمة العفو الدولية.
هذا ليس مجرد إنجاز فني ؛ إنها قفزة كبيرة للشمولية الرقمية. وهذا يعني أن مطورًا في Riga أو Zagreb يمكنه أخيرًا بناء أدوات الذكاء الاصطناعي التي تعمل بالطاقة الصوتية التي تفهم لغاتها المحلية بشكل صحيح. ويمكنهم فعل ذلك بكفاءة أكبر. وجد فريق الأبحاث أن بيانات الخرسانية الخاصة بهم فعالة لدرجة أن الأمر يتطلب حوالي نصف كميةها للوصول إلى مستوى الدقة المستهدفة مقارنة بمجموعات البيانات الشائعة الأخرى.
يوضح النموذجان الجديدان هذه القوة. Canary بصراحة وحش ، حيث تقدم جودة الترجمة وجودة النسخ التي تنافسها ثلاثة أضعاف حجمها ، ولكن مع ما يصل إلى عشرة أضعاف السرعة. في هذه الأثناء ، يمكن أن يمضج الببغاء خلال تسجيل اجتماع مدته 24 دقيقة في واحدة ، ومعرفة اللغة التي يتم التحدث بها تلقائيًا. كلا النموذجين ذكي بما يكفي للتعامل مع علامات الترقيم والرسملة وتوفير الطوابع الزمنية على مستوى الكلمات ، وهو أمر مطلوب لبناء تطبيقات من الدرجة المهنية.
من خلال وضع هذه الأدوات القوية والأساليب وراءها في أيدي مجتمع المطورين العالمي ، فإن Nvidia لا تطلق فقط منتجًا. إنه يبدأ موجة جديدة من الابتكار ، على أمل إنشاء عالم يتحدث فيه الذكاء الاصطناعى لغتك ، بغض النظر عن من أين أنت.
(الصورة من قبل Aedrian Salazar)
انظر أيضا: يعود Deepseek إلى Nvidia لنموذج R2 بعد فشل Huawei AI Chip
هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الكبيرة من قادة الصناعة؟ تحقق من AI و Big Data Expo الذي يقام في أمستردام ، كاليفورنيا ، ولندن. تم تحديد الحدث الشامل مع الأحداث الرائدة الأخرى بما في ذلك مؤتمر الأتمتة الذكي ، و blockx ، وأسبوع التحول الرقمي ، ومعرض Cyber Security & Cloud.
استكشاف أحداث وندوات الويب القادمة الأخرى التي تعمل بها TechForge هنا.