ابتكرت شركة Cerebras الناشئة في مجال أجهزة الذكاء الاصطناعي حلاً جديدًا لاستنتاج الذكاء الاصطناعي يمكنه منافسة عروض GPU من Nvidia للشركات.
تعتمد أداة Cerebras Inference على محرك Wafer-Scale الخاص بالشركة وتعد بتقديم أداء مذهل. وفقًا للمصادر، حققت الأداة سرعات 1800 رمز في الثانية لـ Llama 3.1 8B، و450 رمز في الثانية لـ Llama 3.1 70B. تدعي Cerebras أن هذه السرعات ليست أسرع فقط من منتجات السحابة الضخمة المعتادة المطلوبة لتوليد هذه الأنظمة بواسطة وحدات معالجة الرسومات من Nvidia، ولكنها أيضًا أكثر كفاءة من حيث التكلفة.
وهذا تحول كبير في سوق الذكاء الاصطناعي التوليدي، كما قال المحلل أرون شاندراسيكاران من شركة جارتنر. وفي حين كان تركيز هذا السوق في السابق على التدريب، فإنه يتحول حاليًا إلى تكلفة وسرعة الاستدلال. ويرجع هذا التحول إلى نمو حالات استخدام الذكاء الاصطناعي داخل إعدادات المؤسسات ويوفر فرصة كبيرة للبائعين مثل Cerebras لمنتجات وخدمات الذكاء الاصطناعي للتنافس على أساس الأداء.
كما يقول ميكا هيل سميث، المؤسس المشارك والرئيس التنفيذي لشركة Artificial Analysis، فإن Cerebras تألقت حقًا في معايير الاستدلال بالذكاء الاصطناعي. فقد وصلت قياسات الشركة إلى أكثر من 1800 رمز إخراج في الثانية على Llama 3.1 8B، وكان الإخراج على Llama 3.1 70B أكثر من 446 رمز إخراج في الثانية. وبهذه الطريقة، فقد سجلوا أرقامًا قياسية جديدة في كلا المعيارين.
ومع ذلك، وعلى الرغم من مزايا الأداء المحتملة، تواجه Cerebras تحديات كبيرة في سوق المؤسسات. تهيمن مجموعة البرامج والأجهزة من Nvidia على الصناعة ويتم تبنيها على نطاق واسع من قبل الشركات. يشير ديفيد نيكلسون، المحلل في Futurum Group، إلى أنه في حين يمكن لنظام Cerebras على نطاق الرقاقة تقديم أداء عالي بتكلفة أقل من Nvidia، فإن السؤال الرئيسي هو ما إذا كانت الشركات على استعداد لتكييف عملياتها الهندسية للعمل مع نظام Cerebras.
يعتمد الاختيار بين Nvidia والبدائل مثل Cerebras على عدة عوامل، بما في ذلك حجم العمليات ورأس المال المتاح. من المرجح أن تختار الشركات الأصغر حجمًا Nvidia لأنها تقدم حلولاً راسخة بالفعل. في الوقت نفسه، قد تختار الشركات الأكبر حجمًا ذات رأس المال الأكبر الخيار الأخير لزيادة الكفاءة وتوفير التكاليف.
مع استمرار تطور سوق أجهزة الذكاء الاصطناعي، ستواجه Cerebras أيضًا منافسة من مقدمي الخدمات السحابية المتخصصين، والشركات الضخمة مثل Microsoft وAWS وGoogle، ومقدمي الاستدلال المتخصصين مثل Groq. ومن المرجح أن يشكل التوازن بين الأداء والتكلفة وسهولة التنفيذ قرارات الشركات في تبني تقنيات الاستدلال الجديدة.
إن ظهور الاستدلال بالذكاء الاصطناعي عالي السرعة، القادر على تجاوز 1000 رمز في الثانية، يعادل تطوير الإنترنت عريض النطاق، والذي قد يفتح آفاقًا جديدة لتطبيقات الذكاء الاصطناعي. قد تمكن دقة Cerebras البالغة 16 بت وقدرات الاستدلال الأسرع من إنشاء تطبيقات الذكاء الاصطناعي المستقبلية حيث يجب أن تعمل وكلاء الذكاء الاصطناعي بالكامل بسرعة وبشكل متكرر وفي الوقت الفعلي.
مع نمو مجال الذكاء الاصطناعي، يتوسع سوق أجهزة الاستدلال بالذكاء الاصطناعي أيضًا. حيث يمثل هذا القطاع حوالي 40% من إجمالي سوق أجهزة الذكاء الاصطناعي، ويصبح هدفًا مربحًا بشكل متزايد داخل صناعة أجهزة الذكاء الاصطناعي الأوسع. ونظرًا لأن الشركات الأكثر شهرة تشغل غالبية هذا القطاع، فيجب على العديد من الوافدين الجدد النظر بعناية في الجوانب المهمة لهذا المشهد التنافسي، مع مراعاة الطبيعة التنافسية والموارد الكبيرة المطلوبة للتنقل في مجال المؤسسات.
(تصوير تيموثي دايكس)
انظر أيضًا: الذكاء الاصطناعي السيادي يحصل على دفعة من خدمات NVIDIA الصغيرة الجديدة
هل تريد أن تتعلم المزيد عن الذكاء الاصطناعي والبيانات الضخمة من قادة الصناعة؟ تعرف على معرض الذكاء الاصطناعي والبيانات الضخمة الذي يقام في أمستردام وكاليفورنيا ولندن. يقام هذا الحدث الشامل بالتزامن مع فعاليات رائدة أخرى بما في ذلك مؤتمر الأتمتة الذكية، وBlockX، وأسبوع التحول الرقمي، ومعرض الأمن السيبراني والسحابة.
استكشف الأحداث والندوات عبر الإنترنت الأخرى المتعلقة بتكنولوجيا المؤسسات والتي تدعمها TechForge هنا.