Close Menu
تقنية نيوزتقنية نيوز

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    مقالات قد تهمك

    لعبة “MIMESIS” تتجاوز مليون نسخة مباعة وتحقق إنجازاً لشركة KRAFTON.

    20 ديسمبر, 2025

    انفجار كوني مزدوج يؤدي إلى تشكل “سوبركيلونوفا” غير مسبوق.

    20 ديسمبر, 2025

    ديزني تقترب من استخدام تقنية الطباعة ثلاثية الأبعاد في مناطق الجذب بمركبة (Jungle Cruise).

    20 ديسمبر, 2025
    فيسبوك X (Twitter) الانستغرام
    • من نحن
    • سياسة الخصوصية
    • اتصل بنا
    فيسبوك X (Twitter) الانستغرام يوتيوب
    تقنية نيوزتقنية نيوز
    • الرئيسية
    • اخر الاخبار
    • هواتف ذكية
    • كمبيوتر
    • برامج وتطبيقات
    • شركات
      • ابل
      • سامسونج
      • جوجل
      • مايكروسوفت
      • أمازون
    • المزيد
      • الذكاء الإصطناعي
      • الأمن الإلكتروني
      • ألعاب
      • منوعات تقنية
    اشترك معنا
    تقنية نيوزتقنية نيوز
    الرئيسية » وجدت جوجل أن دقة روبوتات الدردشة بالذكاء الاصطناعي تصل إلى 69% في أفضل الحالات.
    كمبيوتر

    وجدت جوجل أن دقة روبوتات الدردشة بالذكاء الاصطناعي تصل إلى 69% في أفضل الحالات.

    فريق التحريربواسطة فريق التحرير20 ديسمبر, 20250 زيارةلا توجد تعليقات
    شاركها فيسبوك تويتر بينتيريست لينكدإن Tumblr رديت تيلقرام البريد الإلكتروني
    شاركها
    فيسبوك تويتر لينكدإن بينتيريست البريد الإلكتروني

    نشرت شركة جوجل مؤخرًا تقييمًا لمدى موثوقية روبوتات الدردشة بالذكاء الاصطناعي، وكشفت النتائج عن ضعف ملحوظ في دقة هذه النماذج. وأظهرت مجموعة الاختبارات FACTS Benchmark Suite أن أفضل الأنظمة الحالية لا تتجاوز نسبة دقة 70% في تقديم معلومات واقعية. هذا النقص في الموثوقية يثير تساؤلات حول الاعتماد على هذه التقنيات في المجالات الحساسة مثل التمويل والرعاية الصحية.

    أجرت جوجل هذه الاختبارات استجابةً للنمو السريع في استخدام نماذج اللغة الكبيرة (LLMs) والاهتمام المتزايد بقدرتها على معالجة المعلومات وتقديمها. يهدف هذا التقييم إلى تسليط الضوء على التحديات المستمرة في ضمان دقة وموثوقية هذه الأنظمة، خاصةً مع الاعتماد المتزايد عليها في اتخاذ القرارات بناءً على المعلومات المقدمة.

    ما الذي كشفه اختبار دقة جوجل حول روبوتات الدردشة؟

    اعتمدت جوجل في تقييمها على مجموعة اختبارات FACTS Benchmark Suite، وهي أداة جديدة مصممة لقياس الدقة الواقعية لـنماذج الذكاء الاصطناعي عبر سيناريوهات واقعية مختلفة. تركز مجموعة الاختبارات على أربعة مجالات رئيسية: المعرفة القائمة على الحقائق، وأداء البحث، والتأريض (الالتزام بالمصادر المقدمة)، وفهم الوسائط المتعددة.

    تقييم أداء النماذج الرائدة

    وفقًا لنتائج الاختبارات، حقق نموذج Gemini 3 Pro أفضل أداء نسبيًا بدقة إجمالية بلغت 69%. بينما سجل نموذجا Gemini 2.5 Pro و ChatGPT-5 (من OpenAI) حوالي 62%. أما نظام Claude 4.5 Opus فقد حصل على 51% تقريبًا، في حين حدد Grok 4 دقته بنسبة 54%.

    التحديات في فهم الوسائط المتعددة

    أظهرت الاختبارات أن فهم الوسائط المتعددة يمثل نقطة ضعف رئيسية لمعظم روبوتات الدردشة. غالبًا ما كانت دقة هذه النماذج في قراءة المخططات والرسوم البيانية والصور أقل من 50%. هذا يثير قلقًا بالغًا لأن الأخطاء في تفسير البيانات المرئية يمكن أن تكون لها عواقب وخيمة في العديد من التطبيقات العملية.

    أهمية التأريض وتجنب الهلوسة

    يُعد التأريض، أو قدرة النموذج على الالتزام بالمستندات المقدمة دون إضافة معلومات غير صحيحة (ما يُعرف بـ “الهلوسة”)، جانبًا حاسمًا آخر لتقييم الموثوقية. أشارت النتائج إلى أن النماذج لا تزال تواجه صعوبة في هذا المجال، مما قد يؤدي إلى تقديم معلومات مضللة أو غير دقيقة.

    بالإضافة إلى ذلك، تظهر النتائج أن أداء البحث لا يضمن تلقائيًا الدقة. قد تتمكن النماذج من استرداد المعلومات من الويب، لكن قدرتها على التحقق من صحتها وتفسيرها بشكل صحيح لا تزال محدودة. وهذا يسلط الضوء على الحاجة إلى تطوير آليات أكثر فعالية للتحقق من الحقائق وتقييم المصادر.

    لا تعني هذه النتائج أن الذكاء الاصطناعي التوليدي غير فعال، بل تؤكد على أهمية عدم الثقة به بشكل أعمى. يجب دائمًا التحقق من المعلومات التي تقدمها هذه النماذج، خاصةً في المجالات التي تتطلب دقة عالية. ويشير خبراء إلى أن دقة نتائج الذكاء الاصطناعي تتزايد بشكل مستمر، ولكنها لا تزال بحاجة إلى الرقابة البشرية.

    تعتبر هذه التقييمات جزءًا من جهود متسارعة لتطوير معايير موحدة لتقييم أداء نماذج الذكاء الاصطناعي، بما في ذلك جوانب مثل الأمان والتحيز والموثوقية. وتشمل الجهود الأخرى تطوير أدوات وتقنيات جديدة لتحسين دقة هذه النماذج وتقليل أخطائها.

    من المتوقع أن تستمر جوجل في إجراء تقييمات دورية لـنماذج الذكاء الاصطناعي المختلفة، وأن تقوم بتحديث مجموعة FACTS Benchmark Suite بانتظام لتعكس التطورات في هذا المجال. من المرجح أيضًا أن نشهد زيادة في تبني الشركات والمؤسسات لآليات التحقق من الحقائق والإشراف البشري لضمان استخدام هذه التقنيات بشكل مسؤول وفعال. وما زال من غير المؤكد متى ستصل هذه النماذج إلى مستوى الدقة المطلوب للاعتماد عليها بشكل كامل في اتخاذ القرارات الهامة.

    شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr البريد الإلكتروني
    السابقأصبح التعدين الفردي للبيتكوين ميسراً بأداة تعدين تذكرة بقيمة 60 دولاراً.
    التالي سامسونج تُقدم تخفيضًا بقيمة 275 دولارًا على هاتف Galaxy S25 Ultra ضمن عرض ليوم واحد.

    المقالات ذات الصلة

    كمبيوتر

    ديزني تقترب من استخدام تقنية الطباعة ثلاثية الأبعاد في مناطق الجذب بمركبة (Jungle Cruise).

    20 ديسمبر, 2025
    كمبيوتر

    عُثِر على تخفيضات في أسعار أجهزة آبل آيباد (iPad) من الجيل العاشر الجديدة والمُجدّدة لدى تجار التجزئة.

    20 ديسمبر, 2025
    كمبيوتر

    تحصل زوم أيضًا على مساعد ذكاء اصطناعي (AI Assistant) لمكالمات الفيديو.

    20 ديسمبر, 2025
    كمبيوتر

    عروض تجديد أجهزة آيباد مناسبة للتسوق في اللحظات الأخيرة لعيد الميلاد.

    20 ديسمبر, 2025
    كمبيوتر

    تُنهي غوغل تنبيهات خرق البيانات وتُقدم نصائح للحماية.

    20 ديسمبر, 2025
    كمبيوتر

    جمع كاتب العشرات من ملحقات الطباعة ثلاثية الأبعاد على مدى 10 سنوات.

    20 ديسمبر, 2025
    كمبيوتر

    أسعار الذاكرة العشوائية (RAM) مرتفعة، والجهاز المخصص للألعاب بسعة 32 جيجابايت مقابل 979.99 دولار يبدو مغريًا.

    20 ديسمبر, 2025
    كمبيوتر

    يقول الرئيس التنفيذي لـ OpenAI إنّ ChatGPT سيصبح نظام تشغيل.

    19 ديسمبر, 2025
    كمبيوتر

    آخر فرصة هذا العام للحصول على جهاز ماك ميني (Mac Mini) M4 بتخفيض 20%.

    19 ديسمبر, 2025
    اترك تعليقاً
    اترك تعليقاً إلغاء الرد

    Demo
    اخر الاخبار

    كيفية تسجيل مقاطع فيديو محمية بدون شاشة سوداء

    31 يوليو, 20241٬145 زيارة

    سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

    4 يوليو, 2024816 زيارة

    كل ما تريد معرفته عن Reacher الموسم الثالث

    6 مايو, 2024774 زيارة

    يحصل iPhone على أول تطبيق إباحي أصلي له

    4 فبراير, 2025754 زيارة

    Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

    2 أبريل, 2024721 زيارة

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    رائج الآن
    منوعات تقنية

    شات جي بي تي بدون تسجيل.. ChatGPT مجانا بالعربي

    فريق التحرير20 مايو, 2025
    منوعات تقنية

    استخدم chatgpt بالعربي مجانا بدون تسجيل

    فريق التحرير29 مايو, 2025
    ألعاب

    إغلاق متجر بلايستيشن على PS3 وPS Vita في دولة جديدة مطلع عام 2026.

    فريق التحرير17 ديسمبر, 2025
    رائج الآن

    شات جي بي تي بدون تسجيل.. ChatGPT مجانا بالعربي

    20 مايو, 202514 زيارة

    استخدم chatgpt بالعربي مجانا بدون تسجيل

    29 مايو, 202510 زيارة

    إغلاق متجر بلايستيشن على PS3 وPS Vita في دولة جديدة مطلع عام 2026.

    17 ديسمبر, 20259 زيارة
    اختيارات المحرر

    لعبة “MIMESIS” تتجاوز مليون نسخة مباعة وتحقق إنجازاً لشركة KRAFTON.

    20 ديسمبر, 2025

    انفجار كوني مزدوج يؤدي إلى تشكل “سوبركيلونوفا” غير مسبوق.

    20 ديسمبر, 2025

    ديزني تقترب من استخدام تقنية الطباعة ثلاثية الأبعاد في مناطق الجذب بمركبة (Jungle Cruise).

    20 ديسمبر, 2025

    خدمة الإشعارات البريدية

    اشترك في خدمة الإشعارات البريدية ليصلك كل جديد الى بريدك الإلكتروني مباشرة.

    تقنية نيوز
    فيسبوك X (Twitter) الانستغرام يوتيوب لينكدإن تيكتوك
    • الرئيسية
    • سياسة الخصوصية
    • من نحن
    • اتصل بنا
    © 2025 تقنية نيوز. جميع حقوق النشر محفوظة.

    اكتب كلمة البحث ثم اضغط على زر Enter