أعلنت إنتل خلال حدث Vision 2024 أحدث بطاقة مسرّعة للذكاء الاصطناعي باسم Gaudi 3، التي تَعد بتحسينات كبرى مقارنة بالجيل السابق.
وتزعم إنتل أن البطاقة المسرعة Gaudi 3 توفر تحسنًا بنسبة تصل إلى 70% في تدريب الذكاء الاصطناعي، وتحسنًا بنسبة تصل إلى 50% في استدلال الذكاء الاصطناعي، وتحسنًا بنسبة تصل إلى 40% في كفاءة الطاقة مقارنة بوحدة معالجة الرسوم إنفيديا H100، ولكن بتكلفة مالية أدنى بكثير من حلول إنفيديا.
وتأتي البطاقة المسرعة للذكاء الاصطناعي بواجهة الاتصال PCIe من الجيل الخامس مع معدل استهلاك للطاقة يصل إلى 600 واط (TDP).
كما كشفت إنتل عن علامة تجارية جديدة لوحدات المعالجة المركزية الخاصة بمراكز البيانات، إذ قررت إنتل تسمية معالجات Granite Rapids و Sierra Forest باسم سلسلة معالجات Xeon 6، ومن المقرر طرح هذه المعالجات في الأسواق هذا العام، إضافة إلى دعم تنسيق البيانات MXFP4 الجديد الذي يعزز الأداء بوضوح.
وأشارت إنتل إلى دعم تنسيق البيانات MXFP4، الذي يسمح لوحدات المعالجة المركزية بتشغيل نماذج Llama-2 وتقليل زمن انتظار التعليمات البرمجية قرابة 6.5 مرات مقارنة بمعالجات Xeon من الجيل الرابع.
وقد سيطرت شركة إنفيديا على البنية التحتية لبرامج الذكاء الاصطناعي في الآونة الأخيرة، ومع ذلك تسعى إنتل، مثل AMD، إلى اكتساب مكانة كبديل رئيسي لشركة إنفيديا إذ يواصل هذا القطاع مواجهة نقص شديد في وحدات معالجة الرسوم الخاصة بالذكاء الاصطناعي.
وتركز جهود إنتل على تطوير أنظمة تعمل بقوة وحدات Gaudi 3، كما تعمل على بناء مجموعة أدوات برمجية مفتوحة المصدر لتكون بمنزلة بديل لواجهة كودا الخاصة بشركة إنفيديا.
وستدخل هذه البطاقة مرحلة الإنتاج بكميات كبرى في الربع الثالث من عام 2024 في أنظمة الشركات الصانعة للمعدات الأصلية (OEM).
وتزعم إنتل أن البطاقة المسرعة Gaudi 3 توفر ضعف أداء حوسبة FP8 وأربعة أضعاف أداء حوسبة BF16 مقارنة بالجيل السابق، إلى جانب ضعف عرض النطاق الترددي للشبكة و 1.5 مرة ضعف عرض النطاق الترددي للذاكرة.
وتأتي البطاقة المسرعة Gaudi 3 بذاكرة HBM2E بحجم قدره 128 جيجابايت ومع عرض نطاق ترددي للذاكرة يصل إلى 3.7 تيرابايت/ الثانية، موزع على 10 بلاطات، أو كما تسميها إنتل tiles وهي تعرف بمصطلح (بلاطات).
كما تأتي مع ذاكرة وصول عشوائي SRAM بحجم قدره 96 ميجابايت موزعة على اثنتين من بلاطات الحوسبة، وتعمل كذاكرة مخبأة منخفضة المستوى لتسهيل الاتصال بالبيانات من نويات Tensor إلى ذاكرة HBM.