التحول بعيدًا عن مساعد Google ، وفي عصر الجوزاء ، يقع في مراحله الأخيرة تقريبًا. يمكن للمرء أن يشعر بالحنين حيال المساعد الافتراضي المسماة ، ولكن لا يمكن إنكار أن وصول الجوزاء قد غير حقًا ما يمكن أن يفعله وكيل الذكاء الاصطناعي لنا.
قطع فهم اللغة أفضل بكثير مع الجوزاء. المحادثات طبيعية ، وتفاعلات التطبيقات هي سائلة ، والتكامل مع منتجات Google الأخرى مجزية ، وحتى في حالتها الحرة ، يأخذ Gemini Siri إلى المنظفات حتى على iPhone.
ومع ذلك ، هناك بعض الحيل التي تضع الجوزاء في دوري مختلف تمامًا. البحث العميق هو أحد تلك الميزات الوكلاء التي أستخدمها على أساس يومي وما زلت مندهشًا. في مارس ، أضافت Google ميزة مجزية أخرى إلى Arsenal Gemini: نظرة عامة على الصوت.
تحويل كل شيء ، إلى بودكاست
تخيل تحويل مستنداتك الدائرية ، أو ورقة بحث معقدة بشكل علني ، أو مواد القراءة الأكاديمية إلى دردشة بودكاست ثنائية الاتجاه. هذا هو في الأساس نظرة عامة على الصوت. وصلت الميزة لأول مرة على دفتر NotebookLM من Google ، وتم نقلها أخيرًا إلى تجربة Gemini الأساسية على الهاتف المحمول والويب.
ليس عليك أن تمر بأي أطواق تقنية ، أو كتابة موجه نص خاص بـ Hyper Text للحصول على هذه الصراعات الصوتية. ما عليك سوى تحميل ملف من منتقي المرفقات ، وسترى رقاقة “إنشاء نظرة عامة على الصوت” تظهر مباشرة فوق مربع الدردشة. اضغط على ذلك ، وسيبدأ جيل البودكاست.
قد يستغرق الأمر بضع دقائق ، ولكن في الوقت نفسه ، يمكنك التبديل بأمان إلى تطبيق آخر (أو نافذة). بمجرد انتهاء العملية ، ستحصل على إشعار حول كون البودكاست جاهزًا لمتعة الاستماع الخاصة بك ، أو المشاركة مع الآخرين.
النظرة العامة الصوتية هي عادة دردشة خالية من الشخصين في نغمة طبيعية مخيفة. يبدو الأمر كما لو كنت تتحدث مع Gemini Live ، والتي تشعر أنها أكثر طبيعية بشكل كبير من أي chatbot منظمة العفو الدولية التي استخدمتها حتى الآن في وضع المحادثة الصوتية.
هذه البودكاست التي تم إنشاؤها من الذكاء الاصطناعي هي عمومًا جيدة الصنع ، كما أقول. لكنني أنجذب تجاههم لعدة أسباب. أولاً ، أحدق في شاشة ، وقراءة مقالات للبحث ، وكتابة أشيائي الخاصة ، طوال اليوم.
هذا لا يترك مجالًا كبيرًا للانخراط مع أي مواد أخرى قائمة على النص ، سواء أكان أكاديميًا أو مرتبطًا بالعمل أو حتى الترفيه. ومع ذلك ، إذا كان بإمكاني تغيير الوضع الحسي للتفاعل مع هذه المادة ، فإن تعب القراءة الخاص بي يأخذ المقعد الخلفي.
توفر البودكاست الصوتية طريقة جديدة تمامًا للانخراط مع المواد النصية بطريقة أكثر غامرة. هذا يقودنا إلى الميزة الثانية ، وهو التحفيز الحسي ، أو التباين. تم توثيق هذه الصيغة بشكل جيد وتجربة ، في مجال الأوساط الأكاديمية والتدريب المهني.
كيف ساعدني؟
تعب النص يأخذ خسائر خاصة به. إنه يجعل العمل المثير يبدو وكأنه عمل روتيني تحتاج إلى تجاوزه ، لمجرد أنك لا تستطيع تفويتها. ومع ذلك ، فإن الانخراط مع نفس العمل ، أو جوهره ، من خلال وسائط حسية مختلفة يقمع الخوف من التحميل الزائد على المزيد من المواد المستندة إلى النص. إنه في الواقع يساعد بعدة طرق أخرى.
يقول ياسير ناسيم ، خبير علم اللغويات الذي ركز عمله على تحديث ومنهجيات التدريس: “إن إشراك حواس متعددة يقوي الذاكرة. عندما نستمع ونتفاعل – سواء من خلال القراءة أو الكتابة أو القيام به – يبني الدماغ روابط أقوى ، مما يسهل تذكره لاحقًا”.
يخبرني Naseem ، وهو خبير في المناهج في شركة Ed-Tech الرائدة ، أنه لا يمكنك الاعتماد فقط على وسيلة واحدة للتعلم. بدلاً من ذلك ، أخبرني أنك بحاجة إلى الجمع بين طرق مختلفة لتحقيق أقصى فائدة ، بدءًا من التأثير العاطفي إلى الاحتفاظ بالذاكرة.
البحوث المنشورة في أجهزة الكمبيوتر والتعليم سلطت مجلة أيضًا الضوء على كيفية العثور على ملفات الصوت لتكون مواد التعلم والمراجعة الفائقة. لعبت المرونة ، والتنوع الحسي ، دورًا رئيسيًا في تفضيلها للبودكاست على وسائل الإعلام الأخرى.
“الفهم الحقيقي والاحتفاظ على المدى الطويل يحدث عند إقران الاستماع مع الصور المرئية أو المناقشات أو الأنشطة العملية” ، يضيف Naseem. تجربتي الخاصة مع نظرة عامة على الجوزاء الصوتية تتردد نصيحته. لدي تذكر أقوى للمعرفة التي استوعبتها عبر البودكاست الصوتية مقارنة بقراءة نفس المادة.
كما ترى ، فإن هذه البودكاست الصوتية ليست تحويلًا بسيطًا نصًا إلى أمن. بدلاً من ذلك ، يقومون بتفكيك جدار ممل من النص إلى محادثة من شخصين ، فأنت في الأساس الجمهور الوحيد. إنها نعمة لأي مادة مستندة إلى النص لا تثير فضولك على الفور وتجولك في قراءة فورية.
في تجربتي الأخيرة ، ساعدني البودكاست الصوتي في Gemini على فهم أهمية ورقة تناقش “إطارًا للتعلم العصبي القابل للتفسير بناءً على وظائف الأهداف النظرية للمعلومات المحلية”. بعبارات أبسط ، ناقش البحث كيف تنظم الخلايا العصبية نفسها.
هل تحصل على النقطة التي أحاول توضيحها هنا ، أليس كذلك؟
الراحة ، قبل كل شيء
تلعب الراحة دورًا مهمًا عندما يتعلق الأمر بامتصاص المعلومات. وكذلك الحماس والإثارة حول العملية برمتها. حسب ورقة نشرت في أجهزة الكمبيوتر في السلوك البشري مجلة ، podcasts “تعزيز الراحة والمرونة وسهولة الوصول إلى المعلومات والمعرفة.” لم يستغرق الأمر وقتًا طويلاً لأدرك ذلك.
إن العيش في العاصمة الوطنية ، فإن إنفاق ما بين 2-3 ساعات عالقًا في حركة المرور أو التنقل العام هو حقيقة يومية بالنسبة لي. ولكن أكثر من عدم الراحة في كل شيء ، إنه الوقت الضائع الذي يؤلمني أكثر. توفر المواد التعليمية الصوتية الطريقة الأكثر ملاءمة للاستفادة من ذلك الوقت بطريقة مثمرة.
مع الجوزاء ، لديك فائدة حاسمة أخرى. لا يتعين عليك الاعتماد على توافر الصوت لبعض كتاب أو مقالة إخبارية أو مواد أكاديمية. يمكنك فقط تنزيل أي مادة تحت تصرفك ، وسيقوم Gemini بتحويلها إلى محادثة على طراز البودكاست.
هناك الكثير من الأبحاث المتعددة التخصصات التي تدعم فوائد النهج القائم على الصوت في التعلم. ولا يتعلق الأمر فقط بالاستماع ، ولكن المزيد عن تحطيم الأشياء وتقديمها بطريقة أكثر ودودًا.
يقول ورقة بحث نقلا عن محرر الأخبار: “قال اثنان من الناس … إنهم يحبون حقيقة أننا نعطيهم بعض الأشياء التي لا يقرؤونها في الصحيفة. إنهم يحبون الحقيقة … نحن نحاول تقديم أنفسنا بطريقة مختلفة”. تم نشر الورقة ، بإذن من جامعة سيراكيوز ، في عام 2006 خلال الأيام الأولى من اتجاه البودكاست.
اعتبارًا من عام 2025 ، أصبحت البودكاست ظاهرة حقيقية لاستهلاك المعلومات ، من المواد التعليمية إلى الأشياء الترفيهية. وفقًا لمركز بيو للأبحاث ، شارك ما يقرب من نصف الأمريكيين مع البودكاست. استمع أكثر من نصف جمهور الاستطلاع إلى البودكاست للتعلم ، أو للترفيه ، أو الحصول على بعض المواد الصوتية أثناء القيام بشيء آخر.
أراد ما يقرب من الثلث أن يسمع آراء الآخرين ، وتم توصيل جزء آخر كبير بنفس القدر حتى يتمكنوا من مراقبة الأخبار والأحداث الجارية. لم تسقط مشاركتي بعيدًا عن النمط المذكور أعلاه. بالنسبة لقصص الصحافة الطويلة أو العمل الاستقصائي ، غالبًا ما وجدت نسخة البودكاست الخاصة بهم أكثر إرضاء.
أكثر فعالية ، أيضا
ومن المثير للاهتمام ، يبدو أن البودكاست يدفع تغييرات عملية أيضًا. ما يقرب من ثلثي المستمعين الذين شاركوا في كتاب أو فيلم بعد سماع بودكاست ، بدأ أكثر من نصف الجمهور متابعة شخص على وسائل التواصل الاجتماعي ، وجعل ثلثهم تغييرات في نمط الحياة مثل ممارسة التمارين الرياضية أو تغيير نظامهم الغذائي.
الأبحاث المنشورة في مجلة تسويق وسائل التواصل الاجتماعي مفاهيم مميزة مثل استبدال وسائل الإعلام والتشابه الوظيفي في سياق الاستماع إلى وسائل الإعلام واستعداد الجمهور. الفكرة الشاملة هي أن المستخدمين يقيمون الوسيلة واختيار الفكرة التي تناسبهم أكثر.
يقول الورقة: “من أجل تفرد محتويات البودكاست ، فإن التأثير على استعداد الاستماع واستبدال وسائل الإعلام إيجابية ، مما يشير إلى أن المحتويات الفريدة والجودة العالية والتنوع الواسع تجعل الناس يرغبون في الاستماع إلى البودكاست”. يمكنني شخصيا أن أشهد على هذه النتيجة ، كذلك.
– nadeemonics (nsnadeemsarwar) 30 مارس 2025
على مدار الأيام القليلة الماضية ، لدي العديد من الأوراق البحثية “بودكاست” تناقش تأثير الألياف واللحوم والاستهلاك الغذائي المعبأة على أنماط النوم والصحة المعرفية وصحة الأمعاء. بالمقارنة مع النغمة التقنية العلنية للأوراق العلمية ، فإن وجود مضيفين لمحطموا النتائج مع لهجة “عاطفية” و “مقنعة” كان لها تأثير أعمق بشكل متميز.
فكر في الأمر على أنه يتعلم عن الآداب الاجتماعية أو الحساسيات الثقافية في كتاب. وبعد سنوات ، رؤيتهم في العمل مع عينيك. أو فكر في تعلم لغة أجنبية من كتاب ، كل ذلك بمفردك ، والفرق الذي يحدثه عندما تتعلمها من شخص يملأ كل هذه المعرفة في أذنيك.
النهج الأخير يجني نتائج أفضل. وذلك في المقام الأول لأن التأثير المركب للمشاركة متعددة الحواس يسرع في عملية التعلم ، أو يجعلها أكثر فعالية. خلقت نظرة عامة على الجوزاء تأثيرات صوتية تأثير مماثل ، وقد ساعدتني كثيرًا.
عدد قليل من العقبات
على الرغم من أن كل ذلك يبدو مثمرًا ، فإن نظرة عامة على الجوزاء ليست كذلك. يمكنهم استنزاف الجوهر الحقيقي لقصة مكتوبة بذوق في جهودها “Fodcasti-Fational” ، أو تفوت بعض التفاصيل الصغيرة. هناك بضعة شذوذ وظيفي أيضًا. يمكن أن يكون طول نظرة عامة على الصوت ، والذي يتوافق مباشرة مع عمق المادة المصدر ، عشوائيًا تمامًا.
على سبيل المثال ، عندما أطعمته كتابًا من 260 صفحة حول موضوع الاقتران والمورفولوجيا من الأفعال في اللغة الفارسية ، كانت النظرة العامة الصوتية التي تم إنشاؤها بواسطة الجوزاء ما يزيد قليلاً عن سبع دقائق. من الناحية النوعية ، غطت الأجزاء الأكثر أهمية ، ولكن فقدت التفاصيل الدقيقة.
في حالة أخرى ، التفتت وثيقة بحثية عميقة بقيمة أربع صفحات في بودكاست صوتي. كانت مدة هذا حوالي 13 دقيقة. لسوء الحظ ، لن تتيح لك شريحة المهمة التلقائية لـ Gemini ضبط الطول ، أو عمق المحادثة للنظرة العامة الصوتية.
إذا كنت تستخدم Google NotebookLM ، وهو المكان الذي ظهرت فيه ميزة نظرة عامة على الصوت لأول مرة ، فيمكنك كتابة موجه يمكن أن تملي مدى عمق محادثة البودكاست. لقد أنشأت بودكاست صوتي مع 59 وقت تشغيل على NotebookLM قبل بضعة أسابيع.
الجوزاء لن يسمح لك بذلك. ليس بعد.
بعد ذلك ، لدينا حاجز اللغة ، حيث أن Google تعمل حاليًا على صياغة خط الأنابيب بأكمله إلى ما وراء اللغة الإنجليزية. مشكلة أخرى كانت النطق الأنجليكلي. على سبيل المثال ، استضاف بودكاست AI العالم الفارسي “RAF-SHIN” باسم “RAAF-TIN”.
إلى أذن غير مدربة غير على دراية بالفروق الدقيقة ثنائية اللغة للترجمة باللغة الإنجليزية ، أو كيف تغير لهجات الإدراك السمعي للكلمات بلغة مختلفة ، يمكن أن يكون مضيفي البودكاست الذكري الذكري قد تسبق التام.
مجموع تجاربي هو أن نظرة عامة على الصوت الجوزاء ليست ثورة. إنها تقدم وسيطًا مختلفًا وأكثر شغفًا للتفاعل مع المحتوى. إنه لا يعمل طوال الوقت ، لكنه بالتأكيد يستغرق من الملل من القراءة من خلال صفحات النص التي من شأنها أن تنام.