وصل وضع الصوت المتقدم الخاص بـ ChatGPT يوم الثلاثاء لمجموعة مختارة من مشتركي OpenAI الذين تم اختيارهم ليكونوا جزءًا من الإصدار التجريبي للميزة المرتقبة للغاية.
تم الإعلان عن هذه الميزة لأول مرة في شهر مايو. وهي مصممة للتخلص من نافذة السياق التقليدية القائمة على النص والتحدث بدلاً من ذلك باستخدام كلمات طبيعية منطوقة، يتم توصيلها بطريقة واقعية. وهي تعمل بمجموعة متنوعة من اللهجات واللغات الإقليمية. وفقًا لشركة OpenAI، Advanced Voice، “يوفر محادثات أكثر طبيعية في الوقت الفعلي، ويسمح لك بالمقاطعة في أي وقت، ويستشعر عواطفك ويستجيب لها.“
توجد بعض القيود على ما يمكن للمستخدمين أن يطلبوا من Voice Mode القيام به. سيتحدث النظام بأحد الأصوات الأربعة المحددة مسبقًا ولا يمكنه تقليد أصوات الأشخاص الآخرين – سواء كانوا أفرادًا أو شخصيات عامة.
في الواقع، ستمنع هذه الميزة بشكل مباشر المخرجات التي تختلف عن الإعدادات المسبقة الأربعة. علاوة على ذلك، لن يقوم النظام بإنشاء صوت محمي بحقوق الطبع والنشر أو إنشاء موسيقى. لذا، بطبيعة الحال، كان أول شيء فعله شخص ما هو جعله beatbox.
الصوت المتقدم كصبي B
إيقاعات صوتية متقدمة من Yo ChatGPT pic.twitter.com/yYgXzHRhkS
— إيثان سوتين (@EthanSutin) 30 يوليو 2024
نشر مستخدم ألفا إيثان سوتين سلسلة من التدوينات على موقع X (الذي كان يُعرف سابقًا باسم Twitter) تظهر عددًا من ردود Advanced Voice، بما في ذلك التدوينة أعلاه حيث يقوم الذكاء الاصطناعي بغناء “راب عيد ميلاد” قصير ثم ينتقل إلى beatbox. يمكنك في الواقع سماع الذكاء الاصطناعي وهو يتنفس رقميًا بين الإيقاعات.
الصوت المتقدم كراوي للقصص
هذا رائع بالفعل
لم أتوقع الأصوات المشؤومة https://t.co/SgEPi5Bd3K pic.twitter.com/DnK8AVdWjV
— كيسكو (@yoimnotkesku) 30 يوليو 2024
على الرغم من أن Advanced Voice ممنوع من إنشاء الأغاني بالجملة، إلا أنه يمكنه إنشاء مؤثرات صوتية في الخلفية لقصص ما قبل النوم التي يرويها.
في المثال أعلاه من Kesku، يضيف الذكاء الاصطناعي حوادث وصدمات في الوقت المناسب إلى حكايته عن الإنسان الآلي المارق بعد أن يُطلب منه، “أخبرني بقصة إثارة مثيرة مع عناصر خيال علمي وخلق جو من خلال إصدار أصوات مناسبة للأشياء التي تحدث (على سبيل المثال: عاصفة تعوي بصوت عالٍ)”.
أنظروا إلى أعمال OpenAI أيها الأقوياء ويأسوا!
هذا هو الأكثر جنونًا. يمكنك أن تشعر حقًا وكأنك مخرج يوجه ممثلًا شكسبيريًا! pic.twitter.com/GUQ1z8rjIL
— إيثان سوتين (@EthanSutin) 31 يوليو 2024
تتمتع الذكاء الاصطناعي أيضًا بالقدرة على إنشاء شخصيات واقعية على الفور، كما يوضح مثال سوتين أعلاه.
الصوت المتقدم كمتحدث عاطفي
خان!!!!!! pic.twitter.com/xQ8NdEojSX
— إيثان سوتين (@EthanSutin) 30 يوليو 2024
تبدو الميزة الجديدة وكأنها حقيقية إلى حد كبير لأنها قادرة على التعبير عن المشاعر كما يفعل الإنسان. في المثال أعلاه، يعيد إيثان سوتين إنشاء ستار تريك الجزء الثاني في المثالين أدناه، يجبر المستخدم كريستيانو جياردينا الذكاء الاصطناعي على التحدث بنغمات مختلفة ولغات مختلفة.
وضع الصوت المتقدم في ChatGPT يتحدث باللغة اليابانية (بحماس) pic.twitter.com/YDL2olQSN8
– كريستيانو جياردينا (@CrisGiardina) 31 يوليو 2024
وضع الصوت المتقدم في ChatGPT يتحدث الأرمنية (عادي، متحمس، غاضب) pic.twitter.com/SKm73lExdX
– كريستيانو جياردينا (@CrisGiardina) 31 يوليو 2024
صوت متقدم كمحب للحيوانات
— إيثان سوتين (@EthanSutin) 30 يوليو 2024
لا تتوقف مواهب الذكاء الاصطناعي الصوتية عند لغات البشر. في المثال أعلاه، يُطلب من Advanced Voice إصدار أصوات القطط، ويفعل ذلك بدقة لا تخطئ.
محاولة #دردشةGPTوضع الصوت المتقدم الجديد الذي تم إصداره للتو في الإصدار التجريبي. يبدو الأمر وكأنك تتحدث مع صديق واسع المعرفة عبر تطبيق FaceTime، وهو ما كان مفيدًا للغاية في هذه الحالة – حيث طمأننا بشأن قطتنا الصغيرة الجديدة. يمكنه الإجابة على الأسئلة في الوقت الفعلي واستخدام الكاميرا كمدخل أيضًا! pic.twitter.com/Xx0HCAc4To
— مانويل سينسيلي (@ManuVision) 30 يوليو 2024
بالإضافة إلى إصدار صوت يشبه صوت القطط، يمكن للمستخدمين طرح أسئلة على الذكاء الاصطناعي حول أصدقائهم القطط البيولوجيين وتلقي نصائح وإرشادات شخصية في الوقت الفعلي.
Advanced Voice كمترجم في الوقت الفعلي
الترجمة اليابانية في الوقت الحقيقي باستخدام #دردشةGPTوضع الصوت المتقدم الجديد + رؤية ألفا! مثال آخر مفيد! pic.twitter.com/wDXrgYQkZE
— مانويل سينسيلي (@ManuVision) 31 يوليو 2024
يمكن لـ Advanced Voice أيضًا الاستفادة من كاميرا جهازك للمساعدة في جهود الترجمة. في المثال أعلاه، يوجه المستخدم Manuel Sainsily هاتفه إلى جهاز GameBoy Advanced الذي يشغل نسخة باللغة اليابانية من لعبة Pokémon، ويطلب من الذكاء الاصطناعي قراءة الحوار الذي يظهر على الشاشة أثناء اللعب.
وتشير الشركة إلى أن مشاركة الفيديو والشاشة لن تكون جزءًا من الإصدار التجريبي ولكنها ستكون متاحة في وقت لاحق. وتخطط OpenAI لتوسيع الإصدار التجريبي ليشمل مشتركي Plus الإضافيين “على مدار الأسابيع القليلة المقبلة” وستقدمه لجميع مستخدمي Plus “في الخريف”.