على الرغم من التوقعات المتزايدة حول قدرة الذكاء الاصطناعي التوليدي على إحداث ثورة في مجال العمل المعرفي، تشير دراسة حديثة إلى أن هذه التكنولوجيا لا تزال بعيدة عن استبدال المهام المعقدة التي يقوم بها البشر في قطاعات مثل القانون والاستثمار. فقد كشفت شركة Mercor، المتخصصة في بيانات التدريب، عن نتائج اختبارات صارمة تظهر محدودية قدرة الذكاء الاصطناعي على التعامل مع الفوضى والتعقيد المتأصل في العمل الحقيقي.
أصدرت Mercor تقريرًا يوضح أن النماذج الحالية، حتى الأكثر تطوراً، تواجه صعوبات كبيرة في إنجاز مهام تتطلب التنقل بين مصادر معلومات متنوعة وربطها ببعضها البعض. هذا الأمر يثير تساؤلات حول الجدول الزمني المتوقع لـ “الاستبدال” الذي تحدث عنه خبراء التكنولوجيا، بما في ذلك الرئيس التنفيذي لشركة مايكروسوفت، ساتيا ناديلا، قبل عامين.
تحديات تواجه الذكاء الاصطناعي التوليدي في “الاختبار المكتبي”
اعتمدت شركة Mercor في تقييمها على معيار جديد أطلقت عليه APEX-Agents، والذي يختلف عن الاختبارات التقليدية التي تركز على مهام منفصلة مثل كتابة الشعر أو حل المعادلات الرياضية. بدلاً من ذلك، يختبر هذا المعيار قدرة الذكاء الاصطناعي على التعامل مع استفسارات حقيقية من محامين ومستشارين ومصرفيين، تتطلب خطوات متعددة والوصول إلى أنواع مختلفة من البيانات.
أظهرت النتائج أن أفضل النماذج المتاحة حاليًا، مثل Gemini 3 Flash وGPT-5.2، لم تتجاوز نسبة دقة 25% في إنجاز هذه المهام. Gemini 3 Flash حقق أعلى نتيجة بنسبة 24%، يليه GPT-5.2 بنسبة 23%، بينما كانت بقية النماذج أقل من ذلك بكثير. هذا يشير إلى وجود فجوة كبيرة بين قدرات الذكاء الاصطناعي في البيئات الخاضعة للرقابة وبين الواقع العملي.
لماذا يفشل الذكاء الاصطناعي في محاكاة التفكير البشري؟
وفقًا لبريندان فودي، الرئيس التنفيذي لشركة Mercor، فإن المشكلة الرئيسية لا تكمن في نقص القدرة الحسابية للذكاء الاصطناعي، بل في صعوبة التعامل مع السياق. في بيئة العمل الحقيقية، لا يتم تقديم المعلومات بشكل منظم وواضح، بل يجب على المحامي أو المستشار البحث عن المعلومات في مصادر متعددة مثل رسائل البريد الإلكتروني، والمستندات القانونية، وجداول البيانات، ثم تجميعها وتحليلها للوصول إلى استنتاج.
البشر يتمتعون بقدرة طبيعية على تبديل السياق والانتقال بين مصادر المعلومات المختلفة بسلاسة. في المقابل، يواجه الذكاء الاصطناعي صعوبة بالغة في هذه العملية، حيث إما أن يصاب بالارتباك، أو يقدم إجابات غير دقيقة، أو يتوقف عن العمل تمامًا. هذا القصور في التعامل مع السياق يحد من قدرة الذكاء الاصطناعي على أداء المهام المعقدة التي تتطلب تفكيرًا نقديًا وتحليليًا.
الذكاء الاصطناعي كمساعد وليس كبديل
تشير الدراسة إلى أن الذكاء الاصطناعي، في وضعه الحالي، يعمل بشكل أفضل كمساعد للمحترفين وليس كبديل لهم. يمكن اعتباره “متدربًا غير موثوق به” يحتاج إلى إشراف وتصحيح مستمر. ومع ذلك، فإن معدل التحسن في أداء هذه النماذج مثير للإعجاب، حيث ارتفعت نسبة الدقة من 5-10% قبل عام واحد إلى 24% حاليًا.
على الرغم من أن الذكاء الاصطناعي لا يزال غير مستعد لتولي القيادة بشكل كامل، إلا أنه يتعلم بسرعة أكبر مما كان متوقعًا. هذا التقدم يثير تساؤلات حول مستقبل العمل المعرفي وتأثير التعلم الآلي على مختلف الصناعات. بالإضافة إلى ذلك، فإن تطوير نماذج قادرة على التعامل مع السياق بشكل أفضل يمثل تحديًا رئيسيًا للباحثين في مجال الذكاء الاصطناعي.
في الوقت الحالي، تظل ثورة “العمل المعرفي” معلقة حتى تتمكن الروبوتات من إتقان فن التعامل مع المهام المتعددة والبيانات غير المنظمة. من المتوقع أن تشهد السنوات القادمة مزيدًا من التقدم في هذا المجال، مع التركيز على تطوير نماذج أكثر مرونة وقدرة على التكيف مع بيئات العمل الحقيقية. سيظل مراقبة تطورات الذكاء الاصطناعي وتقييم قدراته أمرًا بالغ الأهمية للمهنيين والشركات على حد سواء.
