لقد شاهدت شاشة الموت الزرقاء مرة واحدة فقط يوم الأحد الموافق 21 يوليو/تموز، على مدى 15 ساعة من السفر عبر اثنين من أكبر مطارات البلاد، وذلك بعد يومين فقط من تحديث برمجي فاشل أدى إلى تعطل ملايين أجهزة الكمبيوتر الخاصة بالشركات التي تعمل بنظام التشغيل ويندوز.
أتذكر أنني فكرت بينما كانت عائلتي تتخذ الخطوات الأولى في مطار لاغوارديا في نيويورك حوالي الساعة التاسعة صباحًا: “ربما تكون الأمور على ما يرام”. وعلى عكس ما كانت عليه الحال في اليوم الثالث من الانقطاع الكبير للأنظمة في عام 2024، لم تكن منطقة التذاكر والأمتعة تبدو سيئة للغاية.
كان ينبغي لي أن أعرف بشكل أفضل. فقد اتخذت خطوتين حرفيًا داخل المبنى قبل أن أتلقى أول رسالة بريد إلكتروني من حوالي 3000 رسالة تأخير من دلتا على مدار اليوم، إلى جانب المزيد من الإشعارات من تطبيقات Flighty وFly Delta. لم يكن من السهل العودة من نيويورك إلى فلوريدا، وهو الأمر الذي فعلته عشرات المرات على مر السنين.
أنا لست غريبًا على تأخير الرحلات الجوية. (لقد أمضيت 15 ساعة في Sky Club في مطار لوس أنجلوس الدولي في أواخر يناير – وهو أمر لا أوصي به، على الرغم من مدى جودته). لكن هذه المرة كانت مختلفة. الطقس يحدث. تحدث المشكلات الميكانيكية. إنها سيئة، لكن كل هذه المشاكل ترجع إلى السلامة. هذه المرة؟ أفسد بائع أمان تابع لجهة خارجية ملفًا داخل Windows. كان ينبغي لشركة CrowdStrike اكتشافه. وكان ينبغي لشركة Microsoft اكتشافه. لم يفعل أي منهما حتى فات الأوان. في حين كان الإصلاح بسيطًا نسبيًا – التمهيد في الوضع الآمن، أو الاستمرار في إعادة تشغيل الجهاز حتى يتم استبدال الملف السيئ – كانت التأثيرات الأولية هائلة.
لقد كانت التأثيرات من الدرجة الثانية والثالثة هي السبب الحقيقي وراء تدهور الأمور بالنسبة لشركات الطيران. وقد تضررت شركة دلتا بشكل خاص – حيث كتب الرئيس التنفيذي إد باستيان يوم الأحد أن أكثر من 3500 رحلة تم إلغاؤها حتى يوم السبت، والعديد من الرحلات الأخرى يوم الأحد. قال وكيل البوابة حوالي الساعة 4:30 مساءً يوم الأحد: “يرجى الحضور لرؤيتي على المنصة إذا كنت بحاجة إلى عناق”.
كان الخط أمام مكتب إعادة الحجز في صالة الركاب “أ” في أتلانتا ــ أحد المحطات السبعة في أكثر مطارات البلاد ازدحاما ــ طويلا بشكل مضحك (أو مأساوي). جلست وأنا أضع سماعة أذن واحدة في أذني، على الانتظار في طابور حجز الخطوط الجوية لمدة ساعتين قبل أن أستسلم. (تمكن أخي، الذي يتمتع بمكانة أعلى كثيرا بين المسافر الدائمين، على الأقل من إقناع شخص حقيقي بإخباره بأنه لا توجد طريقة لخروجي قبل منتصف الليل، وأن أفضل شيء يمكن فعله هو الالتزام بالرحلة المحددة في الوقت الحالي).
أخيرًا، في الساعات الأولى من صباح الثلاثاء 22 يوليو، أعطتنا مضيفة طيران فكرة عن السبب الحقيقي وراء هذا الخلل: لم تكن دلتا تعرف مكان وجود طاقمها. وقد تم تأكيد ذلك لاحقًا في نفس اليوم في منشور إخباري آخر من دلتا، والذي قال إن أكثر من نصف نظام تكنولوجيا المعلومات الخاص بها يعمل بنظام Windows، وأن الأمر يتطلب وقتًا إضافيًا للمزامنة حتى بعد إعادة تشغيل الأجهزة المتأثرة.
وتابع المنشور: “إن أطقم عمل دلتا مجهزة بالكامل وجاهزة لخدمة عملائنا. لكن أحد أكثر أنظمة دلتا أهمية – والذي يضمن وجود طاقم كامل في المكان المناسب في الوقت المناسب في جميع الرحلات – معقد للغاية ويتطلب أكبر قدر من الوقت والدعم اليدوي للمزامنة”.
وصلنا إلى المنزل في النهاية في حوالي الساعة الثانية صباحًا. كنا متعبين. ومرهقين بعض الشيء. ولكننا تأخرنا حوالي ثماني ساعات فقط. كنا محظوظين. فقد أمضى أخي حوالي 30 ساعة في مطار أتلانتا قبل يومين، محاولًا فقط العودة إلى منزله في بينساكولا بعد إلغاء رحلة إلى الساحل الغربي. لم تكن هناك رحلات جوية. ولا تأجير سيارات في اتجاه واحد. باستثناء الانتظار، لا توجد خيارات حقيقية أخرى بخلاف شخص يقود سيارته لمدة خمس ساعات في كل اتجاه من أجل إنقاذ شخص.
كانت قصصنا مجرد اثنتين من آلاف القصص الأخرى ــ وكانت قصصنا منخفضة المخاطر نسبيا. فلم يكن لدينا أطفال يسافرون بمفردهم. ولم نتكبد الكثير من النفقات، باستثناء وجبتين لم نخطط لتناولهما في المطار. ووصلت حقائبنا على متن نفس الطائرة.
كان الحل الفوري لفشل كراود سترايك بسيطًا للغاية. إذ يتعين على كراود سترايك ومايكروسوفت وضع سياسات للتخفيف من احتمالية حدوث ذلك مرة أخرى. (سوف يحدث ذلك مرة أخرى بالطبع). ولكن كما يقول المثل – وهذه هي نسخة PG-13 – فإن الفضلات تتدفق إلى أسفل التل. لم يكن أي من هذا خطأ شركات الطيران. ولكن سرعان ما أصبح الأمر فوضويًا يتعين عليها تنظيفه.
وهذا أمر لا يمكن إصلاحه بإعادة تشغيل بسيطة، حتى لو قمت بذلك أكثر من 8 ملايين مرة.