Close Menu
تقنية نيوزتقنية نيوز

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    مقالات قد تهمك

    احصل على جهاز كمبيوتر محمول من شاشة اللمس في Snapdragon من HP مع ذاكرة وصول عشوائي 16 جيجابايت مقابل 439 دولارًا فقط

    25 سبتمبر, 2025

    تعرف على ألعاب PS Plus Essential القادمة لشهر أكتوبر المقبل

    25 سبتمبر, 2025

    تأخذ ساوث بارك على أسواق المراهنة ، ترامب ، و FCC

    25 سبتمبر, 2025
    فيسبوك X (Twitter) الانستغرام
    • من نحن
    • سياسة الخصوصية
    • اتصل بنا
    فيسبوك X (Twitter) الانستغرام يوتيوب
    تقنية نيوزتقنية نيوز
    • الرئيسية
    • اخر الاخبار
    • هواتف ذكية
    • كمبيوتر
    • برامج وتطبيقات
    • شركات
      • ابل
      • سامسونج
      • جوجل
      • مايكروسوفت
      • أمازون
    • المزيد
      • الذكاء الإصطناعي
      • الأمن الإلكتروني
      • ألعاب
      • منوعات تقنية
    اشترك معنا
    تقنية نيوزتقنية نيوز
    الرئيسية » تقوم Samsung بتقييم الإنتاجية الحقيقية لنماذج AI للمؤسسات
    الذكاء الإصطناعي

    تقوم Samsung بتقييم الإنتاجية الحقيقية لنماذج AI للمؤسسات

    فريق التحريربواسطة فريق التحرير25 سبتمبر, 20250 زيارةلا توجد تعليقات
    شاركها فيسبوك تويتر بينتيريست لينكدإن Tumblr رديت تيلقرام البريد الإلكتروني
    شاركها
    فيسبوك تويتر لينكدإن بينتيريست البريد الإلكتروني

    تتغلب Samsung على قيود على المعايير الحالية لتقييم بشكل أفضل إنتاجية العالم الواقعي لنماذج الذكاء الاصطناعى في إعدادات المؤسسة. يهدف النظام الجديد ، الذي طورته شركة Samsung Research و Truebench ، إلى معالجة التباين المتزايد بين أداء الذكاء الاصطناعي النظري وفائدته الفعلية في مكان العمل.

    مع تسريع الشركات في جميع أنحاء العالم تبنيها لنماذج اللغة الكبيرة (LLMs) لتحسين عملياتها ، ظهر تحدٍ: كيفية قياس فعاليتها بدقة. تركز العديد من المعايير الحالية على اختبارات المعرفة الأكاديمية أو العامة ، وغالبًا ما تقتصر على تنسيقات الأسئلة والإجابة باللغة الإنجليزية. لقد خلق ذلك فجوة تترك المؤسسات بدون طريقة موثوقة لتقييم كيفية أداء نموذج الذكاء الاصطناعي على المهام التجارية المعقدة والمتعددة اللغات والغنية بالسياق.

    تم تطوير Samsung’s TrueBench ، المختصرة في معيار تقييم الاستخدام الحقيقي الجدير بالثقة ، لملء هذا الفراغ. يوفر مجموعة شاملة من المقاييس التي تقوم بتقييم LLMs استنادًا إلى السيناريوهات والمهام ذات الصلة مباشرة ببيئات الشركات في العالم الحقيقي. يعتمد المعيار على استخدام المؤسسة الداخلية الواسعة من Samsung لنماذج الذكاء الاصطناعى ، مما يضمن أن معايير التقييم ترتكز على مطالب حقيقية في مكان العمل.

    يقوم الإطار بتقييم وظائف المؤسسة المشتركة مثل إنشاء المحتوى وتحليل البيانات وتلخيص المستندات الطويلة وترجمة المواد. يتم تقسيمها إلى 10 فئات مميزة و 46 فئة فرعية ، مما يوفر رؤية محببة لقدرات إنتاجية الذكاء الاصطناعي.

    وقال بول (كيونغوون) ، CTO من قسم DX في Samsung Electronics ورئيس شركة Samsung Research: “تجلب Samsung Research الخبرة العميقة وسلطة تنافسية من خلال تجربة AI في العالم الحقيقي”. “نتوقع من TrueBench إنشاء معايير التقييم للإنتاجية.”

    لمعالجة القيود المفروضة على المعايير القديمة ، تم بناء TrueBench على أساس 2،485 مجموعة اختبار متنوعة تمتد 12 لغة مختلفة ودعم السيناريوهات اللغوية. هذا النهج متعدد اللغات أمر بالغ الأهمية للشركات العالمية حيث تتدفق المعلومات عبر مناطق مختلفة. تعكس مواد الاختبار نفسها مجموعة متنوعة من طلبات مكان العمل ، بدءًا من تعليمات موجزة بثمانية أحرف فقط إلى التحليل المعقد للوثائق التي تتجاوز 20.000 حرف.

    أدركت Samsung أنه في سياق الأعمال الحقيقية ، لا يتم دائمًا ذكر النية الكاملة للمستخدم بشكل صريح في المطالبة الأولية. لذلك تم تصميم المؤشر لتقييم قدرة نموذج الذكاء الاصطناعى على فهم وتلبية احتياجات المؤسسة الضمنية هذه ، والانتقال إلى أبعد من الدقة البسيطة إلى مقياس أكثر دقة للمساعدة والأهمية.

    لتحقيق ذلك ، طورت Samsung Research عملية تعاونية فريدة بين الخبراء البشريين و AI لإنشاء معايير تسجيل الإنتاجية. في البداية ، تنشئ المذيعون البشريون معايير التقييم لمهمة معينة. ثم يستعرض الذكاء الاصطناعى هذه المعايير ، والتحقق من الأخطاء المحتملة ، أو التناقضات الداخلية ، أو القيود غير الضرورية التي قد لا تعكس توقع مستخدم واقعي. بعد ملاحظات الذكاء الاصطناعى ، يقوم المذيعون البشريون بتحسين المعايير. تضمن هذه الحلقة التكرارية أن تكون معايير التقييم النهائية دقيقة وتعكس نتيجة عالية الجودة.

    توفر هذه العملية المتقاطعة نظام تقييم تلقائي يسجل أداء LLMS. باستخدام الذكاء الاصطناعي لتطبيق هذه المعايير المكررة ، يقلل النظام من التحيز الذاتي الذي يمكن أن يحدث بتسجيل الإنسان فقط ، وضمان الاتساق والموثوقية في جميع الاختبارات. يستخدم TrueBench أيضًا نموذجًا صارمًا للتسجيل حيث يجب أن يفي نموذج الذكاء الاصطناعى بكل حالة مرتبطة باختبار لتلقي علامة عابرة. يتيح هذا النهج كل شيء أو لا شيء للظروف الفردية تقييمًا أكثر تفصيلًا ودقيقًا لأداء نماذج الذكاء الاصطناعى عبر مهام المؤسسات المختلفة.

    لتعزيز الشفافية وتشجيع التبني الأوسع ، جعلت Samsung عينات بيانات TrueBench وألواح المتصدرين متاحة للجمهور على منصة مفتوحة المصدر. يسمح ذلك للمطورين والباحثين والمؤسسات بمقارنة أداء الإنتاجية لما يصل إلى خمسة نماذج مختلفة من الذكاء الاصطناعي في وقت واحد. يوفر المنصة نظرة واضحة ، عند نظرة عامة على كيفية تكديس مختلف AIS ضد بعضها البعض في المهام العملية.

    اعتبارًا من الكتابة ، إليك أفضل 20 طرازًا من خلال التصنيف العام على أساس معايير Samsung من الذكاء الاصطناعي:

    تتضمن البيانات المنشورة الكاملة أيضًا متوسط ​​طول الاستجابات التي تم إنشاؤها من الذكاء الاصطناعي. يسمح ذلك بإجراء مقارنة متزامنة ليس فقط للأداء ولكن أيضًا الكفاءة ، وهو أحد الاعتبارات الرئيسية للشركات التي تزن تكاليف التشغيل والسرعة.

    مع إطلاق TrueBench ، فإن Samsung لا تطلق فقط أداة أخرى ولكنها تهدف إلى تغيير كيفية تفكير الصناعة في أداء الذكاء الاصطناعي. من خلال نقل أهداف الأهداف من المعرفة المجردة إلى الإنتاجية الملموسة ، يمكن أن يلعب معيار Samsung دورًا في مساعدة المنظمات على اتخاذ قرارات أفضل حول نماذج AI للمؤسسة التي تتكامل في سير العمل وسد الفجوة بين إمكانات الذكاء الاصطناعي وقيمتها المثبتة.

    انظر أيضا: داخل خطة Huawei لجعل الآلاف من رقائق الذكاء الاصطناعى يفكرون ككمبيوتر واحد

    لافتة لسلسلة الأحداث معرض AI & Big Data.

    هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الكبيرة من قادة الصناعة؟ تحقق من AI و Big Data Expo الذي يقام في أمستردام ، كاليفورنيا ، ولندن. يعد الحدث الشامل جزءًا من TechEx ويتم تحديده مع الأحداث التكنولوجية الرائدة الأخرى ، انقر هنا لمزيد من المعلومات.

    AI News مدعومة من قبل Techforge Media. استكشاف أحداث وندوات الويب الأخرى القادمة هنا.

    شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr البريد الإلكتروني
    السابقلقد أحرقت من خلال المراجعات المزيفة على الإنترنت. هذا ما أبحث عنه الآن
    التالي “Ghost of yotei” هو تكملة أقوى وذات ذاتي

    المقالات ذات الصلة

    الذكاء الإصطناعي

    داخل خطة Huawei لجعل الآلاف من رقائق الذكاء الاصطناعى يفكرون ككمبيوتر واحد

    25 سبتمبر, 2025
    الذكاء الإصطناعي

    يأتي التبني بتكلفة أمنية عالية

    24 سبتمبر, 2025
    الذكاء الإصطناعي

    تخطط Openai و Nvidia لصفقة رقاقة بقيمة 100 مليار دولار لمستقبل الذكاء الاصطناعي

    24 سبتمبر, 2025
    الذكاء الإصطناعي

    تحكم عصر العميل الذكاء الاصطناعي: الحكم الذاتي مقابل المساءلة

    24 سبتمبر, 2025
    الذكاء الإصطناعي

    جودة البيانات هي مفتاح النمو الذي يحركه الذكاء الاصطناعي

    23 سبتمبر, 2025
    الذكاء الإصطناعي

    يعتبر عجز الثقة العام عقبة كبيرة لنمو الذكاء الاصطناعي

    22 سبتمبر, 2025
    الذكاء الإصطناعي

    كيف يمكن أن تكون BMC هي “أوركستورات أوركستورات” للوكيل المؤسسي AI

    22 سبتمبر, 2025
    الذكاء الإصطناعي

    Techex Europe 2025: التعلم العملي لقادة الذكاء الاصطناعي

    19 سبتمبر, 2025
    الذكاء الإصطناعي

    كريستيان Spindeldreher ، Dell Technologies: تشغيل الذكاء الاصطناعي على نطاق واسع

    19 سبتمبر, 2025
    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    Demo
    اخر الاخبار

    كيفية تسجيل مقاطع فيديو محمية بدون شاشة سوداء

    31 يوليو, 20241٬031 زيارة

    سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

    4 يوليو, 2024789 زيارة

    كل ما تريد معرفته عن Reacher الموسم الثالث

    6 مايو, 2024765 زيارة

    Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

    2 أبريل, 2024714 زيارة

    يحصل iPhone على أول تطبيق إباحي أصلي له

    4 فبراير, 2025626 زيارة

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    رائج الآن
    اخر الاخبار

    “Night of the Reaper” هو جليسة جليدية رجعية مع تطور الغموض

    فريق التحرير20 سبتمبر, 2025
    اخر الاخبار

    تبسيط احتياجات محاسبة عملك مع Intuit QuickBooks ، الآن 64 ٪ خصم

    فريق التحرير28 أبريل, 2025
    اخر الاخبار

    أفضل الألعاب الجنسية في معرض CES 2025

    فريق التحرير13 يناير, 2025
    رائج الآن

    “Night of the Reaper” هو جليسة جليدية رجعية مع تطور الغموض

    20 سبتمبر, 202525 زيارة

    تبسيط احتياجات محاسبة عملك مع Intuit QuickBooks ، الآن 64 ٪ خصم

    28 أبريل, 202514 زيارة

    أفضل الألعاب الجنسية في معرض CES 2025

    13 يناير, 202513 زيارة
    اختيارات المحرر

    احصل على جهاز كمبيوتر محمول من شاشة اللمس في Snapdragon من HP مع ذاكرة وصول عشوائي 16 جيجابايت مقابل 439 دولارًا فقط

    25 سبتمبر, 2025

    تعرف على ألعاب PS Plus Essential القادمة لشهر أكتوبر المقبل

    25 سبتمبر, 2025

    تأخذ ساوث بارك على أسواق المراهنة ، ترامب ، و FCC

    25 سبتمبر, 2025

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    تقنية نيوز
    فيسبوك X (Twitter) الانستغرام يوتيوب لينكدإن تيكتوك
    • الرئيسية
    • سياسة الخصوصية
    • من نحن
    • اتصل بنا
    © 2025 تقنية نيوز. جميع حقوق النشر محفوظة.

    اكتب كلمة البحث ثم اضغط على زر Enter