أطلقت ARC ARCENT ARC-AGI-2 القياسية ، مصحوبة بالإعلان عن مسابقة 2025 مع جوائز بقيمة مليون دولار.
مع تقدم الذكاء الاصطناعى من أداء المهام الضيقة إلى إظهار الذكاء العام والتكيف ، تهدف التحديات ARC-AGI-2 إلى الكشف عن فجوات القدرة وتوجيه الابتكار بنشاط.
“تعمل معايير AGI الجيدة كمؤشرات تقدم مفيدة. معايير أفضل في AGI تميز القدرات بوضوح. أفضل معايير AGI تفعل كل هذا وإلهام الأبحاث وتوجيه الابتكار”.
ARC-AGI-2 يتم تعيينه لتحقيق فئة “أفضل”.
ما وراء الاحتفاظ
منذ إنشائها في عام 2019 ، عملت ARC Prize بمثابة “نجم شمالي” للباحثين الذين يسعون نحو AGI من خلال خلق معايير دائمة.
انحنى معايير مثل ARC-AGI-1 لقياس ذكاء السوائل (أي القدرة على التكيف مع التعلم مع مهام غير مرئية جديدة.) مثلت خروجًا واضحًا عن مجموعات البيانات التي تكافئ الحفظ وحده.
مهمة ARC Prize هي أيضًا تفكير إلى الأمام ، تهدف إلى تسريع الجداول الزمنية لتحقيق الاختراقات العلمية. تم تصميم معاييرها ليس فقط لقياس التقدم المحرز ولكن لإلهام الأفكار الجديدة.
لاحظ الباحثون تحولًا مهمًا مع ظهور Openai's O3 في أواخر عام 2024 ، والذي تم تقييمه باستخدام ARC-AGI-1. الجمع بين نماذج اللغة الكبيرة القائمة على التعلم (LLMS) ومحركات توليف التفكير ، تمثل O3 اختراقًا حيث انتقلت الذكاء الاصطناعى إلى ما وراء الاحتفاظ بالوحدة.
ومع ذلك ، على الرغم من التقدم المحرز ، تظل أنظمة مثل O3 غير فعالة وتتطلب إشرافًا بشريًا كبيرًا أثناء عمليات التدريب. لتحدي هذه الأنظمة من أجل التكيف الحقيقي والكفاءة ، قدمت ARC ARC ARC-AGI-2.
ARC-AGI-2: إغلاق الفجوة البشرية
يعد معيار ARC-AGI-2 أكثر صرامة بالنسبة إلى الذكاء الاصطناعى ، ولكنه يحتفظ بإمكانية وصوله للبشر. في حين تستمر أنظمة التفكير في Frontier AI في النسب المئوية المكونة من رقم واحد على ARC-AGI-2 ، يمكن للبشر حل كل مهمة في محاولتين.
إذن ، ما الذي يميز ARC-AAGI؟ تختار فلسفة التصميم الخاصة بها مهام “سهلة نسبيًا للبشر ، ولكنها صعبة ، أو مستحيلة ، من أجل الذكاء الاصطناعي”.
يشتمل المؤشر على مجموعات بيانات ذات رؤية متفاوتة والخصائص التالية:
- التفسير الرمزي: تكافح الذكاء الاصطناعي لتعيين أهمية دلالية للرموز ، بدلاً من التركيز على المقارنات الضحلة مثل عمليات التماثل.
- التفكير التكويني: يتعثر الذكاء الاصطناعي عندما يحتاج إلى تطبيق قواعد تفاعلية متعددة في وقت واحد.
- تطبيق القاعدة السياقية: تفشل الأنظمة في تطبيق القواعد بشكل مختلف بناءً على سياقات معقدة ، وغالبًا ما تكون مثبتة على أنماط مستوى السطح.
تركز معظم المعايير الحالية على القدرات الخارقة ، واختبار المهارات المتقدمة والمتخصصة على المقاييس التي لا يمكن تحقيقها بالنسبة لمعظم الأفراد.
يقلب ARC-AAGI البرنامج النصي ويسلط الضوء على ما لا يمكن لـ AI فعله بعد ؛ على وجه التحديد القدرة على التكيف التي تحدد الذكاء البشري. عندما تصل الفجوة بين المهام التي يسهل على البشر ، ولكن من الصعب على الذكاء الاصطناعي في نهاية المطاف ، يمكن إعلان AGI.
ومع ذلك ، فإن تحقيق AGI لا يقتصر على القدرة على حل المهام ؛ الكفاءة – التكلفة والموارد اللازمة لإيجاد الحلول – تظهر كعامل محدد حاسم.
دور الكفاءة
يعد قياس الأداء حسب التكلفة لكل مهمة ضروريًا لقياس الذكاء ليس فقط القدرة على حل المشكلات ولكن القدرة على القيام بذلك بكفاءة.
تظهر أمثلة في العالم الحقيقي بالفعل فجوات في الكفاءة بين البشر وأنظمة AI الحدودية:
- كفاءة اللوحة البشرية: يمر المهام ARC-AGI-2 بدقة 100 ٪ عند 17 دولار/مهمة.
- Openai O3: تشير التقديرات المبكرة إلى معدل نجاح بنسبة 4 ٪ عند 200 دولار لكل مهمة.
تؤكد هذه المقاييس على التفاوت في القدرة على التكيف واستهلاك الموارد بين البشر و AI. التزمت ARC Award بالإبلاغ عن الكفاءة إلى جانب الدرجات عبر ألواح المتصدرين في المستقبل.
يمنع التركيز على الكفاءة حلول القوة الغاشمة من اعتبار “الذكاء الحقيقي”.
تشمل الذكاء ، وفقًا لجائزة ARC ، إيجاد حلول ذات موارد الحد الأدنى – جودة إنسانية بشكل واضح ولكنها لا تزال بعيدة المنال بالنسبة إلى الذكاء الاصطناعي.
جائزة قوس 2025
ARC ARC ARC 2025 على Kaggle هذا الأسبوع ، ووعد بمبلغ مليون دولار في إجمالي الجوائز وعرض لوحة المتصدرين المباشرة لتحقيقات مفتوحة المصدر. تهدف المسابقة إلى زيادة التقدم نحو الأنظمة التي يمكنها مواجهة التحديات ARC-AGI-2 بكفاءة.
من بين فئات الجوائز ، التي زادت من مجاميع 2024 ، هي:
- الجائزة الكبرى: 700،000 دولار للوصول إلى 85 ٪ نجاح ضمن حدود كفاءة كاججل.
- جائزة الدرجة الأولى: 75000 دولار لأعلى التقديم.
- الجائزة الورقية: 50000 دولار للأفكار التحويلية التي تسهم في حل مهام ARC-AAGI.
- جوائز إضافية: 175،000 دولار ، مع تفاصيل معلقة معلقة خلال المسابقة.
تضمن هذه الحوافز تقدمًا عادلًا وذات مغزى مع تعزيز التعاون بين الباحثين والمختبرات والفرق المستقلة.
في العام الماضي ، شهدت جائزة ARC 2024 1500 فريق منافس ، مما أدى إلى 40 ورقة من تأثير الصناعة المشهود. تهدف المخاطر المتزايدة لهذا العام إلى رعاية نجاح أكبر.
يعتقد ARC ARC أن التقدم يتوقف على الأفكار الجديدة بدلاً من مجرد تحجيم الأنظمة الحالية. قد لا ينشأ الاختراق التالي في الأنظمة العامة الفعالة من عمالقة التكنولوجيا الحالية ولكن من الباحثين الجريئين المبدعين الذين يتبنون التعقيد والتجريب الغريب.
(الصورة الائتمان: جائزة ARC)
انظر أيضا: Deepseek V3-0324 يتصدر نماذج الذكاء الاصطناع
هل تريد معرفة المزيد عن الذكاء الاصطناعي والبيانات الكبيرة من قادة الصناعة؟ تحقق من AI و Big Data Expo الذي يقام في أمستردام ، كاليفورنيا ، ولندن. تم تحديد الحدث الشامل مع الأحداث الرائدة الأخرى بما في ذلك مؤتمر الأتمتة الذكي ، و blockx ، وأسبوع التحول الرقمي ، ومعرض Cyber Security & Cloud.
استكشاف أحداث وندوات الويب القادمة الأخرى التي تعمل بها TechForge هنا.