نظرًا لأن المزيد من الشركات تتبنى الذكاء الاصطناعي ، فإن اختيار النموذج الذي يجب الذهاب إليه هو قرار كبير. على الرغم من أن النماذج المفتوحة قد تبدو أرخص في البداية ، إلا أن دراسة جديدة تحذر من أن هذه المدخرات يمكن أن تتبخر بسرعة ، نظرًا لقوة الحوسبة الإضافية التي تتطلبها.
في الواقع ، تحترق نماذج الذكاء الاصطناعى مفتوحة المصدر من خلال موارد الحوسبة أكثر بكثير من منافسيها المغلقة عند أداء نفس المهام ، وفقًا لدراسة نشرتها Nous Research يوم الخميس.
اختبر الباحثون عشرات طرز الذكاء الاصطناعى ، بما في ذلك الأنظمة المغلقة من Google و Openai ، بالإضافة إلى نماذج مفتوحة المصدر من Deepseek و Magistral. قاموا بقياس مقدار جهود الحوسبة المطلوبة لكل مهام متطابقة عبر ثلاث فئات: أسئلة المعرفة البسيطة ، ومشاكل الرياضيات ، والألغاز المنطقية.
للقيام بذلك ، استخدموا عدد الرموز التي يستخدم كل نموذج يستخدم لحل الأسئلة والإجابة عليها كما هو الحال بالنسبة للموارد الحاسوبية المستهلكة.
وكتب مؤلفو الدراسة: “تستخدم النماذج ذات الوزن المفتوح 1.5-4 × الرموز المميزة أكثر من الرموز المغلقة-وحتى 10 × لأسئلة المعرفة البسيطة-مما يجعلها في بعض الأحيان أكثر تكلفة لكل استعلام على الرغم من انخفاض تكاليف كل شيء”.
لماذا تهم الكفاءة الرمزية
في الذكاء الاصطناعي ، الرمز المميز هو جزء من النص أو البيانات – يمكن أن يكون كلمة أو جزءًا من كلمة أو حتى علامات ترقيم – التي تستخدمها النماذج لفهم اللغة. تعالج النماذج وإنشاء نص نص واحد في وقت واحد ، وبالتالي كلما زاد عدد الرموز التي يستخدمونها ، زادت قوة الحوسبة والوقت الذي تتطلبه المهمة.
نظرًا لأن معظم نماذج المصدر المغلقة لا تكشف عن عملية التفكير الخام أو سلسلة الفكر (COT) ، فقد قام الباحثون بقياس كفاءة الحوسبة عن طريق حساب الرموز التي استخدموها بدلاً من ذلك. نظرًا لأن النماذج يتم فواتيرها من خلال إجمالي الرموز المميزة المستخدمة في عملية التفكير وإخراج الإجابة النهائية ، فإن الرموز المميزة للإكمال تعمل بمثابة وكيل للجهد اللازم لإنتاج استجابة.
هذا اعتبار مهم للشركات التي تستخدم الذكاء الاصطناعي لأسباب عديدة.
وكتب الباحثون: “أولاً ، أثناء استضافة نماذج الوزن المفتوحة قد تكون أرخص ، يمكن تعويض ميزة التكلفة هذه بسهولة إذا كانت تتطلب المزيد من الرموز المميزة لسبب مشكلة معينة”. “ثانياً ، سيؤدي زيادة عدد الرموز إلى أوقات توليد أطول وزيادة الكمون.”
كانت النماذج المغلقة الفائزين الواضحين
وجدت الدراسة أن النماذج المفتوحة تستخدم باستمرار المزيد من الرموز المميزة من النماذج المغلقة لنفس المهام ، وأحيانًا ثلاثة أضعاف عدد أسئلة المعرفة البسيطة. ضاقت الفجوة إلى أقل من مرتين لمشاكل الرياضيات والمنطق.
“النماذج المغلقة (Openai ، Grok-4) تعمل على تحسين عدد أقل من الرموز لخفض التكاليف ، في حين أن النماذج المفتوحة (Deepseek ، Qwen) تستخدم المزيد من الرموز ، ربما من أجل تفكير أفضل”.
من بين النماذج المفتوحة ، كانت Llama-3.3-nemotron-Super-49b-V1 هي الأكثر كفاءة ، في حين أن نماذج القضاء هي الأكثر فعالية.
كانت نماذج Openai أبرزها أيضًا. أظهرت كل من نماذج O4-Mini ونماذج GPT-OSS الجديدة ذات الأوزان المفتوحة كفاءة رمزية رائعة ، وخاصة في مشاكل الرياضيات.
أشار الباحثون إلى أن نماذج GPT-OSS من Openai ، مع سلسلة من أهمهم ، يمكن أن تكون بمثابة معيار لتحسين كفاءة الرمز المميز في النماذج المفتوحة الأخرى.