تطلق Arc Award أصعب معيار الذكاء الاصطناعي حتى الآن: ARC-AGI-2

أطلقت ARC ARCENT ARC-AGI-2 القياسية ، مصحوبة بالإعلان عن مسابقة 2025 مع جوائز بقيمة مليون دولار.

مع تقدم الذكاء الاصطناعى من أداء المهام الضيقة إلى إظهار الذكاء العام والتكيف ، تهدف التحديات ARC-AGI-2 إلى الكشف عن فجوات القدرة وتوجيه الابتكار بنشاط.

“تعمل معايير AGI الجيدة كمؤشرات تقدم مفيدة. معايير أفضل في AGI تميز القدرات بوضوح. أفضل معايير AGI تفعل كل هذا وإلهام الأبحاث وتوجيه الابتكار”.

ARC-AGI-2 يتم تعيينه لتحقيق فئة “أفضل”.

ما وراء الاحتفاظ

منذ إنشائها في عام 2019 ، عملت ARC Prize بمثابة “نجم شمالي” للباحثين الذين يسعون نحو AGI من خلال خلق معايير دائمة.

انحنى معايير مثل ARC-AGI-1 لقياس ذكاء السوائل (أي القدرة على التكيف مع التعلم مع مهام غير مرئية جديدة.) مثلت خروجًا واضحًا عن مجموعات البيانات التي تكافئ الحفظ وحده.

مهمة ARC Prize هي أيضًا تفكير إلى الأمام ، تهدف إلى تسريع الجداول الزمنية لتحقيق الاختراقات العلمية. تم تصميم معاييرها ليس فقط لقياس التقدم المحرز ولكن لإلهام الأفكار الجديدة.

لاحظ الباحثون تحولًا مهمًا مع ظهور Openai's O3 في أواخر عام 2024 ، والذي تم تقييمه باستخدام ARC-AGI-1. الجمع بين نماذج اللغة الكبيرة القائمة على التعلم (LLMS) ومحركات توليف التفكير ، تمثل O3 اختراقًا حيث انتقلت الذكاء الاصطناعى إلى ما وراء الاحتفاظ بالوحدة.

ومع ذلك ، على الرغم من التقدم المحرز ، تظل أنظمة مثل O3 غير فعالة وتتطلب إشرافًا بشريًا كبيرًا أثناء عمليات التدريب. لتحدي هذه الأنظمة من أجل التكيف الحقيقي والكفاءة ، قدمت ARC ARC ARC-AGI-2.

ARC-AGI-2: إغلاق الفجوة البشرية

يعد معيار ARC-AGI-2 أكثر صرامة بالنسبة إلى الذكاء الاصطناعى ، ولكنه يحتفظ بإمكانية وصوله للبشر. في حين تستمر أنظمة التفكير في Frontier AI في النسب المئوية المكونة من رقم واحد على ARC-AGI-2 ، يمكن للبشر حل كل مهمة في محاولتين.

إذن ، ما الذي يميز ARC-AAGI؟ تختار فلسفة التصميم الخاصة بها مهام “سهلة نسبيًا للبشر ، ولكنها صعبة ، أو مستحيلة ، من أجل الذكاء الاصطناعي”.

يشتمل المؤشر على مجموعات بيانات ذات رؤية متفاوتة والخصائص التالية:

التفسير الرمزي: تكافح الذكاء الاصطناعي لتعيين أهمية دلالية للرموز ، بدلاً من التركيز على المقارنات الضحلة مثل عمليات التماثل.
التفكير التكويني: يتعثر الذكاء الاصطناعي عندما يحتاج إلى تطبيق قواعد تفاعلية متعددة في وقت واحد.
تطبيق القاعدة السياقية: تفشل الأنظمة في تطبيق القواعد بشكل مختلف بناءً على سياقات معقدة ، وغالبًا ما تكون مثبتة على أنماط مستوى السطح.

تركز معظم المعايير الحالية على القدرات الخارقة ، واختبار المهارات المتقدمة والمتخصصة على المقاييس التي لا يمكن تحقيقها بالنسبة لمعظم الأفراد.

يقلب ARC-AAGI البرنامج النصي ويسلط الضوء على ما لا يمكن لـ AI فعله بعد ؛ على وجه التحديد القدرة على التكيف التي تحدد الذكاء البشري. عندما تصل الفجوة بين المهام التي يسهل على البشر ، ولكن من الصعب على الذكاء الاصطناعي في نهاية المطاف ، يمكن إعلان AGI.

ومع ذلك ، فإن تحقيق AGI لا يقتصر على القدرة على حل المهام ؛ الكفاءة – التكلفة والموارد اللازمة لإيجاد الحلول – تظهر كعامل محدد حاسم.

دور الكفاءة

يعد قياس الأداء حسب التكلفة لكل مهمة ضروريًا لقياس الذكاء ليس فقط القدرة على حل المشكلات ولكن القدرة على القيام بذلك بكفاءة.

تظهر أمثلة في العالم الحقيقي بالفعل فجوات في الكفاءة بين البشر وأنظمة AI الحدودية:

كفاءة اللوحة البشرية: يمر المهام ARC-AGI-2 بدقة 100 ٪ عند 17 دولار/مهمة.
Openai O3: تشير التقديرات المبكرة إلى معدل نجاح بنسبة 4 ٪ عند 200 دولار لكل مهمة.

تؤكد هذه المقاييس على التفاوت في القدرة على التكيف واستهلاك الموارد بين البشر و AI. التزمت ARC Award بالإبلاغ عن الكفاءة إلى جانب الدرجات عبر ألواح المتصدرين في المستقبل.

يمنع التركيز على الكفاءة حلول القوة الغاشمة من اعتبار “الذكاء الحقيقي”.

تشمل الذكاء ، وفقًا لجائزة ARC ، إيجاد حلول ذات موارد الحد الأدنى – جودة إنسانية بشكل واضح ولكنها لا تزال بعيدة المنال بالنسبة إلى الذكاء الاصطناعي.

جائزة قوس 2025

ARC ARC ARC 2025 على Kaggle هذا الأسبوع ، ووعد بمبلغ مليون دولار في إجمالي الجوائز وعرض لوحة المتصدرين المباشرة لتحقيقات مفتوحة المصدر. تهدف المسابقة إلى زيادة التقدم نحو الأنظمة التي يمكنها مواجهة التحديات ARC-AGI-2 بكفاءة.

من بين فئات الجوائز ، التي زادت من مجاميع 2024 ، هي:

الجائزة الكبرى: 700،000 دولار للوصول إلى 85 ٪ نجاح ضمن حدود كفاءة كاججل.
جائزة الدرجة الأولى: 75000 دولار لأعلى التقديم.
الجائزة الورقية: 50000 دولار للأفكار التحويلية التي تسهم في حل مهام ARC-AAGI.
جوائز إضافية: 175،000 دولار ، مع تفاصيل معلقة معلقة خلال المسابقة.

تضمن هذه الحوافز تقدمًا عادلًا وذات مغزى مع تعزيز التعاون بين الباحثين والمختبرات والفرق المستقلة.

https://www.youtube.com/watch؟v=Z6CTTKVQAYG

في العام الماضي ، شهدت جائزة ARC 2024 1500 فريق منافس ، مما أدى إلى 40 ورقة من تأثير الصناعة المشهود. تهدف المخاطر المتزايدة لهذا العام إلى رعاية نجاح أكبر.

يعتقد ARC ARC أن التقدم يتوقف على الأفكار الجديدة بدلاً من مجرد تحجيم الأنظمة الحالية. قد لا ينشأ الاختراق التالي في الأنظمة العامة الفعالة من عمالقة التكنولوجيا الحالية ولكن من الباحثين الجريئين المبدعين الذين يتبنون التعقيد والتجريب الغريب.

(الصورة الائتمان: جائزة ARC)

انظر أيضا: Deepseek V3-0324 يتصدر نماذج الذكاء الاصطناع

هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الكبيرة من قادة الصناعة؟ تحقق من AI و Big Data Expo الذي يقام في أمستردام ، كاليفورنيا ، ولندن. تم تحديد الحدث الشامل مع الأحداث الرائدة الأخرى بما في ذلك مؤتمر الأتمتة الذكي ، و blockx ، وأسبوع التحول الرقمي ، ومعرض Cyber Security & Cloud.

استكشاف أحداث وندوات الويب القادمة الأخرى التي تعمل بها TechForge هنا.

مقالات قد تهمك

تحذر الأبحاث من أن مستخدمي الذكاء الاصطناعي قد يكونون أدوات دعائية ذاتية.

تطبيق (ميتافيرس) للواقع الافتراضي يظل قيد التشغيل بصعوبة.

التحول الرقمي في النظام الضريبي السوري: إستراتيجية متكاملة لتحديث الإدارة وتعزيز الكفاءة

يواجه كلود تقطير نموذج الذكاء الاصطناعي “على المستوى الصناعي”.

نوكيا وأمازون ويب سيرفيسز تجربان أتمتة الذكاء الاصطناعي لتقطيع شبكات الجيل الخامس (5G).

استكشاف الذكاء الاصطناعي في قطاع البيع بالتجزئة بآسيا والمحيط الهادئ.

كيف تدمج المؤسسات المالية الذكاء الاصطناعي في عمليات اتخاذ القرار.

يكشف (Murder Mystery 2) عن سلوك ناشئ للاعبين عبر الإنترنت.

يستهدف نموذج تنبؤ بالذكاء الاصطناعي تحسين كفاءة موارد الرعاية الصحية.

يقود الذكاء الاصطناعي التوكيلي (Agentic AI) العائد على الاستثمار المالي في أتمتة الحسابات الدائنة.

قراصنة مدعومون من دول يستغلون الذكاء الاصطناعي في هجمات سيبرانية: جوجل.

كيف يفصل المنطق والبحث عن تعزيز قابلية التوسع لعامل الذكاء الاصطناعي.

مقارنة بين Samsung Galaxy Z Fold 6 و Galaxy S24 Ultra: لا تخطئ

سامسونج جالكسي S25: الأخبار والسعر المتوقع وتاريخ الإصدار والمزيد

يحصل iPhone على أول تطبيق إباحي أصلي له

كل ما تريد معرفته عن Reacher الموسم الثالث

Samsung Galaxy Watch 7: الأخبار والسعر المشاع وتاريخ الإصدار والمزيد

استخدم chatgpt بالعربي مجانا بدون تسجيل

رسمياً: يمكنك لعب GTA Online مجانًا الآن على جميع المنصات المنزلية

أفضل مزودي خدمة الإنترنت المنزلي لعام 2024

رائج الآن