جدول المحتويات
OpenAI تطلق GPT-4o
يساعد وضع الصوت المتقدم أجهزة الكمبيوتر على التحدث مثل البشر
الذكاء الاصطناعي التوليدي يصل إلى الحافة
عودة إنتاج الطاقة النووية
يستعد العملاء ليكونوا الشيء الكبير التالي في مجال الذكاء الاصطناعي التوليدي
ظهور نماذج الاستدلال
ينتشر البحث المدعوم بالذكاء الاصطناعي عبر الإنترنت
قطعة أثرية أنثروبيك تطلق ثورة تعاونية
أخيرًا، اكتشف مولدو الصور والفيديو الأصابع
جهود إيلون موسك البالغة 10 مليارات دولار لبناء أكبر مجموعة تدريب على الذكاء الاصطناعي في العالم
لقد مررنا رسميًا الذكرى السنوية الثانية لبداية طفرة الذكاء الاصطناعي، ولم تتباطأ الأمور. فقط العكس. يتسارع الذكاء الاصطناعي التوليدي بوتيرة تبدو ساحقة تقريبًا، ويتوسع ليشمل منصات ووسائط وحتى أجهزة جديدة بوتيرة لا هوادة فيها.
فيما يلي الإعلانات العشرة التي جعلت من عام 2024 عامًا هائلاً في عالم الذكاء الاصطناعي.
OpenAI تطلق GPT-4o
عندما وصلت ChatGPT (التي تعمل بنظام GPT-3.5) لأول مرة في نوفمبر 2022، كانت في الأساس لعبة Mad Libs الفاخرة التي يتم التحكم فيها بواسطة الكمبيوتر. لا تفهموني خطأ، فحتى هذه القدرة كانت ثورية في ذلك الوقت، ولكن لم تصبح أنظمة الذكاء الاصطناعي التوليدية فعالة إلا بعد إصدار GPT-4o في مايو 2024.
بناءً على قدرة سابقه على تحليل وإنشاء كل من النصوص والصور، GPT-4o يوفر فهمًا سياقيًا أكثر شمولاً مقارنة بـ GPT-4 وحده. تيترجم إلى أداء أفضل في كل شيء بدءًا من التعليق على الصور والتحليل المرئي، وحتى إنشاء محتوى إبداعي وتحليلي مثل الرسوم البيانية والمخططات والصور.
يساعد وضع الصوت المتقدم أجهزة الكمبيوتر على التحدث مثل البشر
في سبتمبر، أظهرت OpenAI مرة أخرى سبب كونها شركة الذكاء الاصطناعي الرائدة من خلال إطلاق وضع الصوت المتقدم الخاص بها لمشتركي ChatGPT. ألغت هذه الميزة حاجة المستخدمين إلى كتابة أسئلتهم في نافذة سريعة، وبدلاً من ذلك تمكنهم من التحدث مع الذكاء الاصطناعي كما يفعلون مع شخص آخر.
من خلال الاستفادة من أوقات الاستجابة المكافئة للإنسان في GPT-4o، غيّر وضع الصوت المتقدم بشكل أساسي كيفية تفاعل الأشخاص مع الذكاء الآلي وساعد المستخدمين على إطلاق العنان للقدرة الإبداعية الكاملة للذكاء الاصطناعي.
الذكاء الاصطناعي التوليدي يصل إلى الحافة
عندما ظهر ChatGPT لأول مرة في عام 2022، كان الذكاء الاصطناعي الوحيد في المدينة ومتوفر في مكان واحد بالضبط: ChatGPT.com. أوه، ما الفرق الذي يحدثه عامين. في هذه الأيام، يمكنك العثور على الذكاء الاصطناعي التوليدي في كل شيء بدءًا من الهواتف الذكية والأجهزة المنزلية الذكية وحتى المركبات ذاتية القيادة وأدوات مراقبة الصحة. ChatGPT، على سبيل المثال، متاح كتطبيق سطح مكتب، وواجهة برمجة تطبيقات، وتطبيق جوال، وحتى عبر رقم 800. قامت Microsoft، من جانبها، بدمج الذكاء الاصطناعي مباشرة في خطها من أجهزة الكمبيوتر المحمولة Copilot+.
ولعل المثال الأكثر أهمية بالطبع هو شركة Apple Intelligence. ربما لم يكن الإطلاق الأكثر نجاحًا (العديد من الميزات التي ما زلنا ننتظرها)، ولكن فيما يتعلق بإتاحة الوصول إلى قوى الذكاء الاصطناعي التوليدي قدر الإمكان، لم يكن هناك شيء مهم مثل ذكاء Apple.
الآن، لم تتمكن أجهزة الكمبيوتر الشخصية Copilot+ أو Apple Intelligence من تحديد الطريقة التي ربما أرادتها الشركات المعنية – خاصة بالنسبة لشركة Microsoft – ولكن كما نعلم جميعًا، هذه هي البداية فقط.
عودة إنتاج الطاقة النووية
قبل هذا العام، كان يُنظر إلى الطاقة النووية على أنها اقتراح خاسر في أمريكا. تم اعتبارها غير موثوقة وغير آمنة، ويرجع ذلك في جزء كبير منه إلى حادثة جزيرة ثري مايل عام 1979 حيث انصهر أحد المفاعلات الرئيسية بالمحطة جزئيًا وقذف مواد مشعة سامة إلى الغلاف الجوي. ومع ذلك، مع الكميات المتزايدة بسرعة من الطاقة الكهربائية التي تتطلبها نماذج اللغات الكبيرة الحديثة – والضغط الهائل الذي تفرضه على شبكات الطاقة الإقليمية – فإن العديد من شركات الذكاء الاصطناعي الرائدة تلقي نظرة فاحصة على تشغيل مراكز البيانات الخاصة بها باستخدام قوة الذرة.
على سبيل المثال، اشترت أمازون مركز بيانات يعمل بالذكاء الاصطناعي من شركة تالين في مارس/آذار، ثم وقعت اتفاقا لشراء مفاعلات نموذجية صغيرة مستقلة ومكتفية ذاتيا من شركة إنيرجي نورثويست في أكتوبر/تشرين الأول. لقد اشترت شركة Microsoft، التي لا ينبغي أن يتفوق عليها أحد، القدرة الإنتاجية لـ Three Mile Island نفسها وتعمل حاليًا على إعادة Reactor One إلى الإنترنت وتوليد الكهرباء.
يستعد العملاء ليكونوا الشيء الكبير التالي في مجال الذكاء الاصطناعي التوليدي
لقد تبين أنه لا يوجد سوى الكثير من بيانات التدريب والطاقة والمياه التي يمكنك الاستعانة بها في مهمة تنمية نموذج اللغة الكبير الخاص بك حتى تواجه مشكلة تناقص العوائد. شهدت صناعة الذكاء الاصطناعي هذا الأمر بشكل مباشر في عام 2024، واستجابةً لذلك، بدأت في الابتعاد عن ماجستير إدارة الأعمال الضخمة التي حددت في الأصل تجربة الذكاء الاصطناعي التوليدية لصالح الوكلاء؛ نماذج أصغر وأكثر استجابة مصممة لأداء مهام محددة، بدلاً من محاولة القيام بكل ما قد يطلبه منها المستخدم.
أطلقت شركة Anthropic وكيلها لأول مرة، والذي أطلق عليه اسم Computer Use، في أكتوبر. وحذت مايكروسوفت حذوها مع Copilot Actions في نوفمبر، بينما يقال إن OpenAI من المقرر أن تطلق ميزة الوكيل الخاصة بها في يناير.
ظهور نماذج الاستدلال
العديد من نماذج اللغات الكبيرة اليوم موجهة بشكل أكبر نحو توليد الاستجابات في أسرع وقت ممكن، وغالبًا ما يكون ذلك على حساب الدقة والصحة. نموذج الاستدلال o1 الخاص بـ OpenAI، والذي أطلقته الشركة كمعاينة في سبتمبر وكنموذج كامل الوظائف في ديسمبر، يتبع النهج المعاكس: فهو يضحي بسرعة الاستجابة للتحقق داخليًا من مبرراته المنطقية لإجابة معينة، مما يضمن أنها دقيقة وكاملة قدر الإمكان.
في حين أن هذه التكنولوجيا لم يتم تبنيها بالكامل من قبل الجمهور (o1 متاح حاليًا فقط لمشتركي الطبقة Plus وPro)، فإن شركات الذكاء الاصطناعي الرائدة تمضي قدمًا في إصدارات خاصة بها. أعلنت جوجل عن إجابتها لـ o1، والتي أطلق عليها اسم Gemini 2.0 Flash Thinking Experimental، في 19 ديسمبر، بينما كشفت OpenAI أنها تعمل بالفعل على خليفة o1، والذي تسميه o3، خلال حدث البث المباشر لمدة 12 يومًا من OpenAI في 20 ديسمبر.
ينتشر البحث المدعوم بالذكاء الاصطناعي عبر الإنترنت
يبدو أن الذكاء الاصطناعي التوليدي منتشر في كل مكان هذه الأيام، فلماذا لا يتم دمجه في إحدى ميزات الإنترنت الأساسية؟ كانت جوجل تتعامل مع هذه التكنولوجيا على مدار العامين الماضيين، حيث أصدرت لأول مرة تجربة البحث المولدة في مايو 2023 قبل طرح ميزة نظرة عامة على الذكاء الاصطناعي في مايو الماضي. تقوم ميزة AI Overview بإنشاء ملخص للمعلومات التي يطلبها المستخدم في أعلى صفحة نتائج البحث الخاصة به.
يأخذ الذكاء الاصطناعي الحائر هذه التقنية خطوة إلى الأمام. يقوم “محرك الإجابات” الخاص به بالبحث في الإنترنت عن المعلومات التي يطلبها المستخدمون، ثم يقوم بتجميع تلك البيانات في استجابة متماسكة ومحادثة (ومستشهد بها)، مما يلغي بشكل فعال الحاجة إلى النقر فوق قائمة الروابط. قامت شركة OpenAI، وهي الشركة المبتكرة على الإطلاق، بتطوير نظام مماثل تقريبًا لروبوت الدردشة الخاص بها، والذي أطلق عليه اسم ChatGPT Search، والذي ظهر لأول مرة في أكتوبر.
قطعة أثرية أنثروبيك تطلق ثورة تعاونية
قد تكون محاولة إنشاء ملفات كبيرة وتحليلها وتحريرها – سواء كانت مقالات إبداعية طويلة أو مقتطفات من تعليمات برمجية للكمبيوتر – مباشرة داخل دفق الدردشة أمرًا مرهقًا، مما يتطلب منك التمرير ذهابًا وإيابًا إلى ما لا نهاية لعرض المستند بالكامل.
تساعد ميزة Anthropic's Artifacts، التي ظهرت لأول مرة في يونيو، في التخفيف من هذه المشكلة من خلال تزويد المستخدمين بنافذة معاينة منفصلة يمكن من خلالها عرض النص المصنوع بواسطة الذكاء الاصطناعي خارج المحادثة الرئيسية. أثبتت هذه الميزة نجاحها لدرجة أن OpenAI سرعان ما حذت حذوها بنسختها الخاصة.
لقد أدت أحدث نماذجها وميزاتها إلى تطوير Anthropic لتصبح خصمًا هائلاً لـ OpenAI وGoogle هذا العام، وهو ما يبدو وحده مهمًا.
أخيرًا، اكتشف مولدو الصور والفيديو الأصابع
استخدم التحكم في الكاميرا لتوجيه كل لقطة بقصد.
تعلم كيفية القيام بذلك مع Runway Academy اليوم. pic.twitter.com/vCGMkkhKds
— المدرج (@runwayml) 2 نوفمبر 2024
كان من المعتاد أن يكون اكتشاف صورة أو مقطع فيديو تم إنشاؤه بواسطة الذكاء الاصطناعي أمرًا بسيطًا مثل حساب عدد الزوائد التي يظهرها الموضوع – من الواضح أنه تم إنشاء أي شيء أكثر من ذراعين وساقين و10 أصابع، كما أظهرت صور Cronenberg المشابهة لـ Stable Diffusion 3 في يونيو. ومع ذلك، مع اقتراب عام 2024 من نهايته، أصبح التمييز بين المحتوى البشري والمحتوى المصنوع آليًا أكثر صعوبة بشكل كبير حيث قامت مولدات الصور والفيديو بتحسين جودة مخرجاتها ودقتها الفسيولوجية بسرعة.
أصبحت أنظمة الفيديو المدعومة بالذكاء الاصطناعي مثل Kling وGen 3 Alpha وMovie Gen قادرة الآن على إنشاء مقاطع واقعية بأقل قدر من التشويه والتحكم الدقيق في الكاميرا، بينما يمكن لأمثال Midjourney وDall-E 3 وImagen 3 إنشاء صور ثابتة باستخدام درجة مذهلة من الواقعية (والحد الأدنى من التحف المهلوسة) في عدد لا يحصى من الأساليب الفنية.
أوه نعم، وأخيرًا ظهر Sora من OpenAI لأول مرة كجزء من إعلاناته في ديسمبر. تحتدم المعركة من أجل نماذج الفيديو المولدة بواسطة الذكاء الاصطناعي، وقد أصبحت مثيرة للإعجاب بشكل صادم في عام 2024.
جهود إيلون موسك البالغة 10 مليارات دولار لبناء أكبر مجموعة تدريب على الذكاء الاصطناعي في العالم
أطلقت شركة xAI برنامج Grok 2.0 هذا العام، وهو أحدث طراز مدمج مباشرة في X. لكن الأخبار الأكبر حول مشروع Elon Musk للذكاء الاصطناعي تدور حول الاتجاه الذي سيتجه إليه هذا الأمر في المستقبل. في عام 2024، شرع إيلون ماسك في بناء “أكبر كمبيوتر عملاق في العالم” خارج مدينة ممفيس بولاية تينيسي مباشرةً، والذي تم تشغيله في الساعة 4:20 صباحًا يوم 22 يوليو. وباستخدام 100000 وحدة معالجة رسوميات Nvidia H100، تم تكليف المجموعة العملاقة بتدريب إصدارات جديدة من XAI. نموذج Grok للذكاء الاصطناعي التوليدي، والذي يزعم ماسك أنه سيصبح “أقوى الذكاء الاصطناعي في العالم”.
ومن المتوقع أن ينفق Musk حوالي 10 مليارات دولار من تكاليف رأس المال والاستدلال في عام 2024 وحده، ولكن يقال إنه يعمل على مضاعفة عدد وحدات معالجة الرسومات التي تشغل الكمبيوتر العملاق في العام الجديد.