Close Menu
تقنية نيوزتقنية نيوز

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    مقالات قد تهمك

    تقول شركة جوجل إنه يتم إساءة استخدام الذكاء الاصطناعي على المستوى الصناعي لشن هجمات إلكترونية، وقد أحبطت واحدة للتو

    19 مايو, 2026

    تتبع اللياقة البدنية قيد التدقيق حيث كشف تسرب البيانات العسكرية في Strava عن الأفراد

    10 مايو, 2026

    واتساب تتخلّى عن ميزة صور “الأفاتار” بعد أعوام من إطلاقها

    5 مايو, 2026
    فيسبوك X (Twitter) الانستغرام
    • من نحن
    • سياسة الخصوصية
    • اتصل بنا
    فيسبوك X (Twitter) الانستغرام يوتيوب
    تقنية نيوزتقنية نيوز
    • الرئيسية
    • اخر الاخبار
    • هواتف ذكية
    • كمبيوتر
    • برامج وتطبيقات
    • شركات
      • ابل
      • سامسونج
      • جوجل
      • مايكروسوفت
      • أمازون
    • المزيد
      • الذكاء الإصطناعي
      • الأمن الإلكتروني
      • ألعاب
      • منوعات تقنية
    اشترك معنا
    تقنية نيوزتقنية نيوز
    الرئيسية » يعمل Tencent على تحسين اختبار نماذج الذكاء الاصطناعي الإبداعي مع معيار جديد
    الذكاء الإصطناعي

    يعمل Tencent على تحسين اختبار نماذج الذكاء الاصطناعي الإبداعي مع معيار جديد

    فريق التحريربواسطة فريق التحرير9 يوليو, 20252 زيارةلا توجد تعليقات
    شاركها فيسبوك تويتر بينتيريست لينكدإن Tumblr رديت تيلقرام البريد الإلكتروني
    شاركها
    فيسبوك تويتر لينكدإن بينتيريست البريد الإلكتروني

    قدمت Tencent معيارًا جديدًا ، ArtifactSbench ، يهدف إلى إصلاح المشكلات الحالية في اختبار نماذج الذكاء الاصطناعي الإبداعي.

    من أي وقت مضى طلب من الذكاء الاصطناعى بناء شيء مثل صفحة ويب بسيطة أو مخطط وتلقى شيء يعمل ولكن لديه تجربة مستخدم سيئة؟ قد تكون الأزرار في المكان الخطأ ، أو قد تصطدم الألوان ، أو أن الرسوم المتحركة تشعر بالحيوية. إنها مشكلة شائعة ، وتسلط الضوء على تحد كبير في عالم تطوير الذكاء الاصطناعي: كيف تقوم بتدريس آلة لتذوق جيد؟

    لفترة طويلة ، كنا نختبر نماذج الذكاء الاصطناعى على قدرتها على كتابة التعليمات البرمجية الصحيح وظيفيًا. يمكن أن تؤكد هذه الاختبارات أن الكود الذي سيتم تشغيله ، لكنهم كانوا “أعمى تمامًا عن الإخلاص المرئي والنزاهة التفاعلية التي تحدد تجارب المستخدم الحديثة”.

    هذه هي المشكلة الدقيقة التي تم تصميم ArtifactsBench لحلها. إنه أقل من اختبار وأكثر من ناقد الفن الآلي للرمز الذي تم إنشاؤه من الذكاء الاصطناعى

    🚀thrilled لتقديم #artifactsbench! نحن نسد الفجوة المرئية التفاعلية في تقييم توليد الكود.

    يستخدم Benchmark خط أنابيب تلقائي متعدد الوسائط جديد لتقييم LLMS على 1825 مهمة متنوعة. يقوم MLLM-charge بتقييم القطع الأثرية البصرية ، وتحقيق تصنيف 94.4 ٪ … pic.twitter.com/84xclcnnys

    – Hunyuan (tencenthunyuan) 9 يوليو 2025

    الحصول عليها بشكل صحيح ، مثل الإنسان كان يجب

    لذا ، كيف يعمل معايير منظمة العفو الدولية من Tencent؟ أولاً ، يتم منح الذكاء الاصطناعى مهمة إبداعية من كتالوج يزيد عن 1800 تحدي ، من بناء تصور البيانات وتطبيقات الويب إلى صنع ألعاب مصغرة تفاعلية.

    بمجرد إنشاء الذكاء الاصطناعي ، يعمل ArtifactsBench. يقوم تلقائيًا بإنشاء الكود ويديره في بيئة آمنة ورملية.

    لمعرفة كيفية تصرف التطبيق ، يلتقط سلسلة من لقطات الشاشة مع مرور الوقت. يتيح ذلك التحقق من أشياء مثل الرسوم المتحركة ، وتغيير الحالة بعد النقر على الزر ، وردود فعل المستخدمين الديناميكية الأخرى.

    أخيرًا ، يقوم بتسليم كل هذه الأدلة – الطلب الأصلي ، ورمز الذكاء الاصطناعى ، ولقطات الشاشة – إلى LLM متعدد الوسائط (MLLM) ، للعمل كقاضي.

    لا يعطي قاضي MLLM هذا الرأي الغامض ويستخدم بدلاً من ذلك قائمة مراجعة مفصلة لكل المهمة لتسجيل النتيجة عبر عشرة مقاييس مختلفة. يتضمن التسجيل الوظائف ، وتجربة المستخدم ، وحتى الجودة الجمالية. هذا يضمن أن التسجيل عادل ومتسق وشامل.

    السؤال الكبير هو ، هل يتمتع هذا القاضي الآلي في الواقع بذوق جيد؟ النتائج تشير إلى أنها تفعل.

    عندما تمت مقارنة التصنيفات من ArtifactSbench مع WebDev Arena ، المنصة القياسية الذهبية حيث يصوت البشر الحقيقيون على أفضل إبداعات الذكاء الاصطناعي ، فإنها تتوافق مع تناسق 94.4 ٪. هذه قفزة هائلة من المعايير الآلية القديمة ، والتي تمكنت فقط من الاتساق حوالي 69.4 ٪.

    علاوة على ذلك ، أظهرت أحكام الإطار أكثر من 90 ٪ اتفاق مع المطورين البشريين المحترفين.

    يقوم Tencent بتقييم إبداع نماذج العليا من الذكاء الاصطناعي مع معيارها الجديد

    عندما وضع تينسنت أكثر من 30 من أفضل طرازات الذكاء الاصطناعي في العالم من خلال خطواتها ، كانت اللوحة المتصدرين تكشف. في حين أن النماذج التجارية العليا من Google (Gemini-2.5-Pro) والأنثروبور (Claude 4.0-Sonnet) تولى زمام المبادرة ، اكتشفت الاختبارات رؤية رائعة.

    قد تعتقد أن منظمة العفو الدولية متخصصة في كود الكتابة ستكون الأفضل في هذه المهام. لكن العكس كان صحيحا. وجد البحث أن “القدرات الشاملة للنماذج العامة غالباً ما تتفوق على تلك الخاصة بالألوان المتخصصة.”

    يتغلب النموذج للأغراض العامة ، Qwen-2.5-instruct ، على أشقائه الأكثر تخصصًا ، و QWEN-2.5-COMER (نموذج خاص بالدولة) و QWEN2.5-VL (نموذج متخصص في الرؤية).

    يعتقد الباحثون أن هذا يرجع إلى أن إنشاء تطبيق بصري رائع لا يتعلق فقط بالترميز أو الفهم البصري في عزلة ويتطلب مزيجًا من المهارات.

    “التفكير القوي ، والتعليمات الدقيقة التالية ، والشعور الضمني لتصميم جماليات التصميم” ، يبرز الباحثون على سبيل المثال المهارات الحيوية. هذه هي أنواع القدرات التي تشبه الإنسان تقريبًا والتي تشبه الإنسان تقريبًا والتي بدأت أفضل النماذج العامة في التطور.

    تأمل Tencent أن يتمكن معيار ArtifactSbench من تقييم هذه الصفات بشكل موثوق وبالتالي قياس التقدم المستقبلي في قدرة الذكاء الاصطناعي على إنشاء أشياء ليست وظيفية فحسب ، بل ما يريد المستخدمون استخدامه بالفعل.

    انظر أيضا: Tencent Hunyuan3d-polygen: نموذج للأصول ثلاثية الأبعاد “للفن”

    هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الكبيرة من قادة الصناعة؟ تحقق من AI و Big Data Expo الذي يقام في أمستردام ، كاليفورنيا ، ولندن. تم تحديد الحدث الشامل مع الأحداث الرائدة الأخرى بما في ذلك مؤتمر الأتمتة الذكي ، و blockx ، وأسبوع التحول الرقمي ، ومعرض Cyber ​​Security & Cloud.

    استكشاف أحداث وندوات الويب القادمة الأخرى التي تعمل بها TechForge هنا.

    شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr البريد الإلكتروني
    السابقتعطل هذا جهاز كمبيوتر ميني Ryzen 5 بدعم من ثلاثة شاشة مقابل 236 دولارًا
    التالي إذا كانت اللياقة البدنية هي الشيء الخاص بك ، فإن هذه Shokz OpenRun Pro 2 أصبحت الآن بأفضل سعر لها على الإطلاق

    المقالات ذات الصلة

    الذكاء الإصطناعي

    العمل الحر في عصر الذكاء الاصطناعي 2026: مهارات لازم تتعلمها الآن

    19 أبريل, 2026
    الذكاء الإصطناعي

    تحويل النص إلى فيديو بالذكاء الاصطناعي: أفضل مواقع 2026

    18 أبريل, 2026
    الذكاء الإصطناعي

    ثورة وكلاء الذكاء الاصطناعي (AI Agents) :هل سيستبدلون الموظفين في 2026؟

    18 أبريل, 2026
    الذكاء الإصطناعي

    أفضل أفكار مشاريع رقمية مربحة في 2026 بدون رأس مال كبير

    17 أبريل, 2026
    الذكاء الإصطناعي

    الذكاء الاصطناعي في التسويق الإلكتروني: استراتيجيات تحقق أرباح خيالية

    17 أبريل, 2026
    الذكاء الإصطناعي

    أفضل مواقع الربح من الإنترنت بدون رأس مال 2026 (دليل علمي مجرب)

    16 أبريل, 2026
    الذكاء الإصطناعي

    أقوى ترندات التكنولوجيا في 2026: ماذا ينتظر العالم الرقمي؟

    16 أبريل, 2026
    الذكاء الإصطناعي

    كيف تربح من ChatGPT في عام 2026: طرق عملية للمبتدئين والمحترفين

    15 أبريل, 2026
    الذكاء الإصطناعي

    أفضل أدوات الذكاء الاصطناعي 2026: كيف تضاعف إنتاجيتك في دقائق؟

    15 أبريل, 2026
    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    Demo
    اخر الاخبار

    مقارنة بين Samsung Galaxy Z Fold 6 و Galaxy S24 Ultra: لا تخطئ

    25 يوليو, 20241٬192 زيارة

    يحصل iPhone على أول تطبيق إباحي أصلي له

    4 فبراير, 2025876 زيارة

    سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

    4 يوليو, 2024831 زيارة

    كل ما تريد معرفته عن Reacher الموسم الثالث

    6 مايو, 2024786 زيارة

    Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

    2 أبريل, 2024732 زيارة

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    رائج الآن
    ألعاب

    رسمياً: يمكنك لعب GTA Online مجانًا الآن على جميع المنصات المنزلية

    فريق التحرير11 نوفمبر, 2025
    ألعاب

    أفضل 10 ألعاب مجانية على الكمبيوتر مع روابط التحميل المباشر

    فريق التحرير29 يوليو, 2024
    ألعاب

    إعدادان بسيطان يغيران تجربة لعبة (Red Dead Redemption 2) جذريًا.

    فريق التحرير5 يناير, 2026
    رائج الآن

    رسمياً: يمكنك لعب GTA Online مجانًا الآن على جميع المنصات المنزلية

    11 نوفمبر, 202518 زيارة

    أفضل 10 ألعاب مجانية على الكمبيوتر مع روابط التحميل المباشر

    29 يوليو, 202413 زيارة

    إعدادان بسيطان يغيران تجربة لعبة (Red Dead Redemption 2) جذريًا.

    5 يناير, 202612 زيارة
    اختيارات المحرر

    تقول شركة جوجل إنه يتم إساءة استخدام الذكاء الاصطناعي على المستوى الصناعي لشن هجمات إلكترونية، وقد أحبطت واحدة للتو

    19 مايو, 2026

    تتبع اللياقة البدنية قيد التدقيق حيث كشف تسرب البيانات العسكرية في Strava عن الأفراد

    10 مايو, 2026

    واتساب تتخلّى عن ميزة صور “الأفاتار” بعد أعوام من إطلاقها

    5 مايو, 2026

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    تقنية نيوز
    فيسبوك X (Twitter) الانستغرام يوتيوب لينكدإن تيكتوك
    • الرئيسية
    • سياسة الخصوصية
    • من نحن
    • اتصل بنا
    © 2026 تقنية نيوز. جميع حقوق النشر محفوظة.

    اكتب كلمة البحث ثم اضغط على زر Enter