تهدف Anthropic إلى إصلاح إحدى أكبر المشكلات في مجال الذكاء الاصطناعي في الوقت الحالي

بعد الإعلان عن أن نموذج اللغة الكبير Claude 3.5 Sonnet الخاص بها تفوق على نماذج رائدة أخرى، بما في ذلك GPT-4o و Llama-400B، أعلنت شركة Anthropic الناشئة في مجال الذكاء الاصطناعي يوم الاثنين أنها تخطط لإطلاق برنامج جديد لتمويل تطوير اختبارات معيارية مستقلة لجهات خارجية لتقييم نماذجها القادمة.

وبحسب منشور على إحدى مدونات الشركة، فإنها على استعداد لدفع المال لمطوري الطرف الثالث لإنشاء معايير يمكنها “قياس القدرات المتقدمة في نماذج الذكاء الاصطناعي بشكل فعال”.

وكتبت أنثروبيك في منشور على مدونتها يوم الاثنين: “إن استثمارنا في هذه التقييمات يهدف إلى الارتقاء بمجال سلامة الذكاء الاصطناعي بالكامل، وتوفير أدوات قيمة تعود بالنفع على النظام البيئي بأكمله. ولا يزال تطوير تقييمات عالية الجودة وذات صلة بالسلامة يشكل تحديًا، والطلب يفوق العرض”.

وتريد الشركة تقديم معايير للمساعدة في قياس “مستوى الأمان” النسبي للذكاء الاصطناعي بناءً على عدد من العوامل، بما في ذلك مدى مقاومته لمحاولات فرض الاستجابات التي قد تشمل الأمن السيبراني؛ والكيميائية والبيولوجية والإشعاعية والنووية (CBRN)؛ وعدم التوافق والتلاعب الاجتماعي ومخاطر الأمن القومي الأخرى. وتبحث أنثروبيك أيضًا عن معايير للمساعدة في تقييم القدرات المتقدمة للنماذج وهي على استعداد لتمويل “تطوير عشرات الآلاف من أسئلة التقييم الجديدة والمهام الشاملة التي من شأنها أن تتحدى حتى طلاب الدراسات العليا”، واختبار قدرة النموذج على تجميع المعرفة من مجموعة متنوعة من المصادر، وقدرته على رفض طلبات المستخدم الخبيثة المصاغة بذكاء، وقدرته على الاستجابة بلغات متعددة.

تبحث شركة Anthropic عن مهام “صعبة بدرجة كافية” وكبيرة الحجم يمكن أن تشمل ما يصل إلى “الآلاف” من المختبرين عبر مجموعة متنوعة من تنسيقات الاختبار التي تساعد الشركة في تقديم معلومات عن جهودها في نمذجة التهديدات “الواقعية والمرتبطة بالسلامة”. نرحب بأي مطورين مهتمين بتقديم مقترحاتهم إلى الشركة، التي تخطط لتقييمها على أساس مستمر.

مقالات قد تهمك

لقد ذهب موقع Dictionary.com إلى أبعد من ذلك، حيث قام بتسمية 6-7 “كلمة” لهذا العام

تم حذف مقاطع فيديو YouTube “الخطيرة” لتجاوزها إعداد حساب Windows 11

هل نستطيع أن نقول أن Xbox قد مات فعلاً؟

فوجيتسو تكشف عن FMV UX-K3.. أخف حاسوب محمول في العالم

أحمد الخلافي: “HPE” تقود حقبة جديدة من الحوسبة والذكاء الاصطناعي المستدام في المنطقة

آبل تطرح MacBook Pro بمعالج M5.. بداية جديدة للذكاء الاصطناعي في الحواسيب المحمولة

مايكروسوفت تُقدّم تحديثات أمان ويندوز 10 مجانًا في أوروبا

أندرويد يدخل عالم الحواسيب.. مشروع طَموح مشترك بين جوجل وكوالكوم

أقل من كيلوجرام واحد.. آيسر تكشف عن حاسوبها المحمول Swift Air 16 الأخف وزنًا

مايكروسوفت تُعيد تصميم الوضع الداكن في ويندوز 11 بعد سنوات من الانتقادات

آبل تستعد لإطلاق حاسوب ماك بوك منخفض التكلفة

مايكروسوفت تقرر إيقاف نظام Windows 11 SE المنافس لنظام كروم

كيفية تسجيل مقاطع فيديو محمية بدون شاشة سوداء

سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

كل ما تريد معرفته عن Reacher الموسم الثالث

Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

يحصل iPhone على أول تطبيق إباحي أصلي له

استخدم chatgpt بالعربي مجانا بدون تسجيل

يحصل iPhone على أول تطبيق إباحي أصلي له

كيفية تسجيل مقاطع فيديو محمية بدون شاشة سوداء

رائج الآن

استخدم chatgpt بالعربي مجانا بدون تسجيل

يحصل iPhone على أول تطبيق إباحي أصلي له

كيفية تسجيل مقاطع فيديو محمية بدون شاشة سوداء

اختيارات المحرر

لقد ذهب موقع Dictionary.com إلى أبعد من ذلك، حيث قام بتسمية 6-7 “كلمة” لهذا العام

تم حذف مقاطع فيديو YouTube “الخطيرة” لتجاوزها إعداد حساب Windows 11

هل نستطيع أن نقول أن Xbox قد مات فعلاً؟

خدمة الإشعارات البريدية

مقالات قد تهمك

تهدف Anthropic إلى إصلاح إحدى أكبر المشكلات في مجال الذكاء الاصطناعي في الوقت الحالي

المقالات ذات الصلة

خدمة الإشعارات البريدية