دخلت Cisco في سباق تنافسي متزايد للسيطرة على تقنية التوصيل البيني لمراكز بيانات الذكاء الاصطناعي، لتصبح أحدث لاعب رئيسي يكشف النقاب عن أجهزة توجيه مصممة خصيصًا لربط أعباء عمل الذكاء الاصطناعي الموزعة عبر منشآت متعددة.
كشفت شركة الشبكات العملاقة عن نظام التوجيه 8223 الخاص بها في 8 أكتوبر، حيث قدمت ما تدعي أنه أول جهاز توجيه ثابت في الصناعة بسرعة 51.2 تيرابت في الثانية مصمم خصيصًا لربط مراكز البيانات التي تشغل أحمال عمل الذكاء الاصطناعي.
تكمن في جوهرها شريحة Silicon One P200 الجديدة، التي تمثل إجابة Cisco للتحدي الذي يقيد صناعة الذكاء الاصطناعي بشكل متزايد: ماذا يحدث عندما لا يكون لديك مجال للنمو.
معركة ثلاثية من أجل التفوق الشامل؟
وللتوضيح، فإن شركة Cisco ليست الوحيدة التي تدرك هذه الفرصة. أطلقت Broadcom الدفعة الأولى في منتصف أغسطس باستخدام شرائح التبديل/جهاز التوجيه “Jericho 4” StrataDNX، والتي بدأت في أخذ العينات وقدمت أيضًا 51.2 تيرابايت/ثانية من إجمالي عرض النطاق الترددي مدعومًا بذاكرة HBM للتخزين المؤقت العميق للحزم لإدارة الازدحام.
بعد أسبوعين من إعلان Broadcom، كشفت Nvidia النقاب عن شبكتها واسعة النطاق Spectrum-XGS، وهو اسم جريء بشكل ملحوظ نظرًا لأن محولات ASIC الخاصة بـ Broadcom “Trident” و”Tomahawk” تنتمي إلى عائلة StrataXGS.
قامت Nvidia بتأمين CoreWeave كعميل رئيسي لها ولكنها قدمت تفاصيل فنية محدودة حول Spectrum-XGS ASICs. وتقوم شركة Cisco الآن بطرح مكوناتها الخاصة لسوق الشبكات الشاملة، مما يؤدي إلى إقامة منافسة ثلاثية بين شركات الشبكات ذات الوزن الثقيل.
المشكلة: الذكاء الاصطناعي أكبر من أن يتسع لمبنى واحد
لفهم سبب اندفاع العديد من البائعين إلى هذا المجال، فكر في حجم البنية التحتية الحديثة للذكاء الاصطناعي. يتطلب تدريب نماذج لغوية كبيرة أو تشغيل أنظمة الذكاء الاصطناعي المعقدة آلاف المعالجات عالية الطاقة التي تعمل بشكل متضافر، وتولد كميات هائلة من الحرارة وتستهلك كميات هائلة من الكهرباء.
وصلت مراكز البيانات إلى حدود صارمة، ليس فقط فيما يتعلق بالمساحة المتاحة، ولكن أيضًا فيما يتعلق بحجم الطاقة التي يمكنها توفيرها وتبريدها.
قال مارتن لوند، نائب الرئيس التنفيذي لمجموعة الأجهزة المشتركة بشركة Cisco: “إن حوسبة الذكاء الاصطناعي تتفوق على قدرة حتى أكبر مركز بيانات، مما يزيد الحاجة إلى اتصال موثوق وآمن لمراكز البيانات التي تبعد مئات الأميال عن بعضها البعض”.
لقد تعاملت الصناعة تقليديًا مع تحديات القدرات من خلال نهجين: التوسع (إضافة المزيد من القدرة إلى الأنظمة الفردية) أو التوسع (ربط المزيد من الأنظمة داخل نفس المنشأة).
لكن كلتا الاستراتيجيتين وصلتا إلى حدودهما. تنفد المساحة المادية لمراكز البيانات، ولا تستطيع شبكات الطاقة توفير ما يكفي من الكهرباء، ولا تستطيع أنظمة التبريد تبديد الحرارة بسرعة كافية.
وهذا يفرض نهجًا ثالثًا: “النطاق الشامل”، وتوزيع أعباء عمل الذكاء الاصطناعي عبر مراكز بيانات متعددة قد تكون في مدن مختلفة أو حتى ولايات مختلفة. ومع ذلك، فإن هذا يخلق مشكلة جديدة، وهي أن الروابط بين هذه المرافق تصبح اختناقات خطيرة.
لماذا تفشل أجهزة التوجيه التقليدية؟
تتصرف أحمال عمل الذكاء الاصطناعي بشكل مختلف عن حركة مرور مركز البيانات النموذجية. تولد عمليات التدريب أنماطًا هائلة ومتفجرة لحركة البيانات، وهي فترات من حركة البيانات المكثفة يتبعها هدوء نسبي. إذا لم تتمكن الشبكة التي تربط مراكز البيانات من استيعاب هذه الزيادات، فإن كل شيء يتباطأ، مما يؤدي إلى إهدار موارد الحوسبة باهظة الثمن، والأهم من ذلك، الوقت والمال.
لم يتم تصميم معدات التوجيه التقليدية لهذا الغرض. تعطي معظم أجهزة التوجيه الأولوية إما للسرعة الأولية أو لإدارة حركة المرور المتطورة، ولكنها تواجه صعوبة في توفير كليهما في وقت واحد مع الحفاظ على استهلاك معقول للطاقة. بالنسبة لتطبيقات الربط البيني لمراكز بيانات الذكاء الاصطناعي، تحتاج المؤسسات إلى العناصر الثلاثة: السرعة والتخزين المؤقت الذكي والكفاءة.
إجابة سيسكو: نظام 8223
يمثل نظام Cisco 8223 خروجًا عن معدات التوجيه ذات الأغراض العامة. وهو موجود في هيكل مدمج مكون من ثلاث وحدات رفوف، ويوفر 64 منفذًا من الاتصال بسرعة 800 جيجابت – وهي حاليًا أعلى كثافة متوفرة في نظام توجيه ثابت. والأهم من ذلك، أنه يمكنه معالجة أكثر من 20 مليار حزمة في الثانية وتوسيع نطاق الاتصال البيني بما يصل إلى ثلاثة إكسابايت في الثانية.
الميزة المميزة للنظام هي إمكانية التخزين المؤقت العميق، والتي يتم تمكينها بواسطة شريحة P200. فكر في المخازن المؤقتة كمناطق تخزين مؤقتة للبيانات، مثل الخزان الذي يتجمع فيه الماء أثناء هطول الأمطار الغزيرة. عندما يؤدي تدريب الذكاء الاصطناعي إلى زيادة في حركة المرور، تمتص المخازن المؤقتة 8223 الارتفاع، مما يمنع ازدحام الشبكة الذي قد يؤدي إلى إبطاء مجموعات GPU باهظة الثمن التي تجلس في وضع الخمول في انتظار البيانات.
تعد كفاءة الطاقة ميزة مهمة أخرى. باعتباره نظام 3RU، يحقق 8223 ما تصفه Cisco بـ “كفاءة الطاقة الشبيهة بالمحول” مع الحفاظ على قدرات التوجيه – وهو أمر بالغ الأهمية عندما تكون مراكز البيانات تستنزف ميزانيات الطاقة بالفعل.
ويدعم النظام أيضًا البصريات المتماسكة بسرعة 800 جيجا، مما يتيح اتصالات تمتد لمسافة تصل إلى 1000 كيلومتر بين المرافق، وهو أمر ضروري للتوزيع الجغرافي للبنية التحتية للذكاء الاصطناعي.
اعتماد الصناعة وتطبيقات العالم الحقيقي
يقوم كبار المقياس الفائق بنشر هذه التكنولوجيا بالفعل. لقد وجدت Microsoft، وهي من أوائل الشركات التي تبنت Silicon One، أن البنية ذات قيمة عبر حالات الاستخدام المتعددة.
أشار ديف مالتز، الزميل الفني ونائب رئيس شركة Azure Networking في Microsoft، إلى أن “بنية ASIC المشتركة جعلت من السهل علينا التوسع من حالات الاستخدام الأولية لدينا إلى أدوار متعددة في بيئات DC وWAN وAI/ML.”
تخطط Alibaba Cloud لاستخدام P200 كأساس لتوسيع بنية eCore الخاصة بها. صرح دينيس كاي، نائب الرئيس ورئيس البنية التحتية للشبكة في Alibaba Cloud، أن الشريحة “ستمكننا من التوسع في الشبكة الأساسية، واستبدال أجهزة التوجيه التقليدية القائمة على الهيكل بمجموعة من الأجهزة التي تعمل بنظام P200.”
تستكشف Lumen أيضًا كيفية تناسب هذه التكنولوجيا مع خطط البنية التحتية لشبكتها. قال ديف وارد، كبير مسؤولي التكنولوجيا ومسؤول المنتجات في Lumen، إن الشركة “تستكشف كيف يمكن أن تتلاءم تقنية Cisco 8223 الجديدة مع خططنا لتحسين أداء الشبكة وتقديم خدمات فائقة الجودة لعملائنا.”
قابلية البرمجة: تحصين الاستثمار في المستقبل
أحد الجوانب التي غالبًا ما يتم التغاضي عنها في البنية التحتية للربط البيني لمراكز بيانات الذكاء الاصطناعي هو القدرة على التكيف. تتطور متطلبات شبكات الذكاء الاصطناعي بسرعة، مع ظهور بروتوكولات ومعايير جديدة بانتظام.
تتطلب الأجهزة التقليدية عادةً استبدالًا أو ترقيات باهظة الثمن لدعم القدرات الجديدة. تعالج قابلية برمجة P200 هذا التحدي.
يمكن للمؤسسات تحديث السيليكون لدعم البروتوكولات الناشئة دون استبدال الأجهزة – وهو أمر مهم عندما تمثل أنظمة التوجيه الفردية استثمارات رأسمالية كبيرة وتظل معايير شبكات الذكاء الاصطناعي في حالة تغير مستمر.
الاعتبارات الأمنية
يؤدي توصيل مراكز البيانات على بعد مئات الأميال إلى ظهور تحديات أمنية. يتضمن 8223 تشفيرًا بمعدل الخط باستخدام خوارزميات ما بعد الكم المرنة، لمعالجة المخاوف بشأن التهديدات المستقبلية من الحوسبة الكمومية. يوفر التكامل مع منصات إمكانية المراقبة الخاصة بشركة Cisco مراقبة تفصيلية للشبكة لتحديد المشكلات وحلها بسرعة.
هل تستطيع سيسكو المنافسة؟
ومع مطالبة شركتي Broadcom وNvidia بالفعل بمطالباتهما في سوق الشبكات الشاملة، تواجه Cisco منافسة قائمة. ومع ذلك، توفر الشركة مزايا: تواجد طويل الأمد في شبكات المؤسسات ومقدمي الخدمات، ومحفظة Silicon One الناضجة التي تم إطلاقها في عام 2019، والعلاقات مع كبار المتوسعين الفائقين الذين يستخدمون بالفعل تقنيتها.
يتم شحن الطراز 8223 في البداية بدعم SONiC مفتوح المصدر، مع التخطيط لتوفر IOS XR في المستقبل. سيكون جهاز P200 متاحًا عبر أنواع منصات متعددة، بما في ذلك الأنظمة المعيارية ومجموعة Nexus.
يمكن أن تكون هذه المرونة في خيارات النشر حاسمة حيث تسعى المؤسسات إلى تجنب تقييد البائعين أثناء بناء البنية التحتية الموزعة للذكاء الاصطناعي.
يبقى أن نرى ما إذا كان نهج Cisco هو المعيار الصناعي لربط مراكز بيانات الذكاء الاصطناعي، ولكن المشكلة الأساسية التي يعالجها البائعون الثلاثة جميعًا – وهي ربط البنية التحتية الموزعة للذكاء الاصطناعي بكفاءة – سوف تصبح أكثر إلحاحًا مع استمرار أنظمة الذكاء الاصطناعي في التوسع خارج حدود المنشأة الفردية.
قد يتم تحديد الفائز الحقيقي في النهاية ليس من خلال المواصفات الفنية وحدها، ولكن من خلال البائع الذي يمكنه تقديم النظام البيئي الأكثر اكتمالًا من البرامج والدعم وقدرات التكامل حول السيليكون الخاص به.
أنظر أيضا:
هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الضخمة من قادة الصناعة؟ اطلع على معرض الذكاء الاصطناعي والبيانات الضخمة الذي يقام في أمستردام وكاليفورنيا ولندن. يعد هذا الحدث الشامل جزءًا من TechEx ويقام في مكان مشترك مع أحداث تكنولوجية رائدة أخرى بما في ذلك معرض الأمن السيبراني، انقر هنا لمزيد من المعلومات.
يتم تشغيل AI News بواسطة TechForge Media. استكشف الأحداث والندوات عبر الإنترنت القادمة الأخرى المتعلقة بتكنولوجيا المؤسسات هنا.