ثلاثة افتراضات تقتل معظم مشاريع الذكاء الاصطناعي الرأسية قبل الشهر الثالث. لا أحد يتحقق من أيٍّ منها قبل اختيار المعمارية، وقبل بدء الهندسة، وقبل تخصيص الميزانية.
الافتراض الأول: البيانات موجودة ونظيفة بما يكفي للاستخدام. الثاني: العملية مستقرة بما يكفي للأتمتة. الثالث: ثمة صاحب قرار سيتصرف بناءً على مخرج الذكاء الاصطناعي. والثلاثة كثيراً ما تكون خاطئة. تكلفة اكتشاف ذلك في الشهر الثامن ليست كتكلفة اكتشافه في الأسبوع الثاني.
سباق الاكتشاف هو آلية التحقق من صحة هذه الافتراضات أو دحضها قبل أن تصبح مكلفة. يكلف أربعة أسابيع من العمل المنظّم. ويوفّر ما تبقى.
الافتراضات الثلاثة التي تقتل مشاريع الذكاء الاصطناعي الرأسية
البيانات موجودة ومتاحة. معظم بيانات المؤسسات معزولة في صوامع، وغير متسقة، وغير موثقة، أو خاضعة لضوابط وصول تعيق حالة الاستخدام المقصودة. مجموعة البيانات التي وُصفت في اجتماع الانطلاق بأنها “متاحة بسهولة” تبيّن لاحقاً أنها تستلزم موافقة ثلاثة أقسام، واستخراجاً من نظام لا توثيق لواجهة برمجية تطبيقاته، وعمل تنظيف قُدِّر بأسبوعين فاستغرق أربعة أشهر.
لا يمكن بناء نظام الذكاء الاصطناعي المُصمَّم حول تلك البيانات كما خُطِّط له. الخيارات في الشهر السادس: إعادة بناء مسار البيانات مع تغيير الجدول الزمني، أو تقليص النطاق مع تغيير القيمة، أو الإلغاء. والخيارات الثلاثة أكثر كلفة من جرد بيانات لأسبوعين في مرحلة الاكتشاف.
العملية مستقرة بما يكفي للأتمتة. العملية كما هي موثقة والعملية كما تُمارَس مختلفتان. وهما تختلفان في كل مؤسسة عملت لأكثر من خمس سنوات. النظام المدرَّب على الإجراءات الموثقة يصطدم بمشغّلين حقيقيين طوّروا حلولاً تجاوزية وتصنيفات غير رسمية وتعاملاً مع الاستثناءات غير موجود في أي كتابة.
النتيجة: نظام يؤدي أداءً جيداً في الاختبارات المُتحكَّم فيها ويخفق في أيدي المستخدمين الفعليين. ليس لأن النموذج خاطئ. بل لأن النموذج دُرِّب على عملية لا يتبعها المستخدمون.
ثمة صاحب قرار سيتصرف بناءً على مخرج الذكاء الاصطناعي. نظام الذكاء الاصطناعي دون صاحب قرار هو مشروع بحثي. يمكن للنظام أن يُنتج توصيات ممتازة ولا شيء يتغير، لأن لا أحد مُخوَّل أو مُحاسَب على التصرف بناءً عليها. تتراكم النشرات الخاوية في المؤسسات بهذه الطريقة: أنظمة أنتجت مخرجات جيدة لم يُهيَّأ أحد لاستخدامها.
ما يُنتجه سباق الاكتشاف فعلياً
لا يُنتج سباق الاكتشاف خارطة طريق شرائحية بمراحل ومعالم. بل يُنتج مجموعة من الفرضيات المُتحقَّق منها أو المدحوضة حول حالة استخدام بعينها.
المخرجات الخمسة مُسلَّمات ملموسة، لا تحليل:
خريطة العملية. ما يحدث فعلاً، موثقاً من الملاحظة الميدانية، لا من وثائق العملية. تشمل الاستثناءات والحلول التجاوزية والأحكام غير الموثقة. تُبنى بالتحدث مع المشغّلين الفعليين لا مع أصحاب العملية.
جرد البيانات. ما هو موجود، وأين يقطن، ومن يتحكم في الوصول، وما هي مشاكل الجودة الموجودة، وما هي التحويلات المطلوبة لجعلها قابلة للاستخدام. كل افتراض بيانات يُختبر على أرض الواقع، لا على ما يعتقده أحد صحيحاً.
خريطة أصحاب القرار. لكل مخرج مقترح للذكاء الاصطناعي: من يتخذ هذا القرار اليوم، ومن سيتخذه بعد إدخال الذكاء الاصطناعي، ومن هو المسؤول حين يكون الذكاء الاصطناعي مخطئاً، وما مسار التصعيد للمخرجات ذات الثقة المنخفضة. هذا مُسلَّم يتعلق بالأشخاص والحوكمة، لا بالتقنية.
تقدير القيمة. ما هي تكلفة المشكلة اليوم من وقت الموظفين والأخطاء والفرص الضائعة أو الخدمات الخارجية؟ هذا هو أساس محادثة واقعية بشأن العائد على الاستثمار، وإعادة التحقق من جدوى حالة الاستخدام.
جرد المخاطر. القيود التنظيمية، ومتطلبات خصوصية البيانات، وتعقيد التكامل، ومتطلبات التراجع، وأنماط الفشل التي يجب معالجتها قبل النشر.
مدة السباق عادةً أسبوعان إلى أربعة أسابيع. يستلزم خبرة متخصصة بالمجال، ومعماري ذكاء اصطناعي يستطيع ترجمة النتائج إلى قيود النظام، والوصول إلى صانعي القرار الذين يمتلكون العملية. لا يمكن تفويضه كلياً لفريق تقنية المعلومات.
فحص واقعية البيانات
أكثر نتيجة شائعة في الاكتشاف: البيانات التي تُشغّل حالة الاستخدام المقصودة غير موجودة في صورة قابلة للاستخدام.
الأشكال المحددة لهذا الأمر مهمة لتحديد نطاق ما يأتي بعده. البيانات موجودة في ملفات PDF دون استخراج نصي موثوق. البيانات تستلزم ربط ثلاثة أنظمة بلا مخطط موثق. البيانات موجودة لكن إجراء الوصول إليها يستغرق أطول من الجدول الزمني للمشروع. البيانات موجودة لكنها شحيحة جداً في المجال ذي الصلة لدعم الاستخدام المقصود.
كل حالة مشكلة مختلفة بحل مختلف. معرفة الشكل الذي يتخذه الفجوة قبل الالتزام بتصميم نظام هو الفارق بين نطاق قابل للبناء ووعد غير قابل للتسليم.
تدرّج نضج البيانات ينطبق على معظم بيئات المؤسسات. بعض المؤسسات لديها بيانات منظّمة ومتاحة حيث يمكن لمشاريع الذكاء الاصطناعي أن تتحرك بسرعة. معظمها لديها بيانات منظّمة لكن معزولة تستلزم عمل تكامل قبل أن تكون طبقة الاسترجاع مفيدة. كثير منها لديها بيانات غير منظمة ومتفرقة تستلزم مسار استيعاب كشرط مسبق لكل شيء آخر.
تحديد نطاق المشروع الأول بما هو متاح فعلاً من البيانات، لا بما يُفترض وجوده نظرياً، هو انضباط البيانات الذي يفرضه الاكتشاف.
مشكلة أمانة العملية
توثيق العملية القياسي يصف العملية المثالية. الذكاء الاصطناعي المدرَّب عليها يتعلم نسخة من العملية يتعرف عليها الموظفون لكنهم لا يتبعونها.
تقنية الاكتشاف التي تكشف العملية الحقيقية هي مرافقة العملية: مراقبة المشغّلين الفعليين أو إجراء مقابلات معهم، لا مع أصحاب العملية. الهدف توثيق الاستثناءات والحلول التجاوزية والأساليب الاستدلالية غير الموثقة التي تميّز كيفية إنجاز العمل فعلاً عن كيفية توثيقه.
نظام تصنيف الوثائق المدرَّب على التصنيف الرسمي يُصنّف الوثائق التي يُسمّيها الممارسون باختصارات غير رسمية تصنيفاً خاطئاً. ذكاء اصطناعي دعم العملاء المدرَّب على قاعدة المعرفة يخفق في الاستفسارات التي يتعامل معها الوكلاء المخضرمون بمعلومات تعيش في الممارسة لا في أي مصدر موثق.
مُسلَّم أمانة العملية في سباق الاكتشاف هو خريطة تُحدد أين تتباعد العملية الموثقة والممارسة الفعلية. تلك الخريطة تقود أهم قرار قبل بدء الهندسة: أي نسخة من العملية يجب تدريب النظام على اتباعها؟ النسخة الموثقة، الأنظف والأسهل صيانةً لكنها قد لا تتطابق مع سلوك المستخدم؟ أم النسخة الممارَسة، التي تطابق الواقع لكنها أصعب توثيقاً وصيانة؟
لا إجابة شاملة. لكلتيهما تكاليف. سباق الاكتشاف هو ما يجعل القرار مقصوداً لا ضمنياً.
شرط صاحب القرار
نظام الذكاء الاصطناعي دون صاحب قرار هو مشروع بحثي. هذه ليست نقداً. بل خاصية هيكلية.
صاحب القرار هو الشخص أو الدور المحدد الذي يتصرف بناءً على مخرج الذكاء الاصطناعي، ويراجع الحالات الاستثنائية، ويوافق على التوصيات عالية المخاطر، وهو المسؤول حين يكون النظام مخطئاً. دون تحديد هذا الدور وتعيينه قبل النشر، تتبع سلسلة من الإخفاقات المتوقعة.
يُستخدم النظام بشكل متذبذب لأن أشخاصاً مختلفين يطبقون عتبات مختلفة لتحديد متى يثقون بالمخرج. تتراكم الحالات الاستثنائية دون تغذية راجعة لأن لا أحد مسؤول عن مراجعتها. يتراجع النظام بهدوء حتى يفرض فشله إيقافه.
الحد الأدنى من الحوكمة قبل الإطلاق: صاحب قرار واحد مُسمَّى، وإيقاع مراجعة محدد للمخرجات ذات الثقة المنخفضة، ومسار تصعيد موثق. هذا ليس تمريناً في الامتثال. بل هو الشرط الهيكلي لنظام يتحسن بمرور الوقت بدلاً من أن يتراجع نحو اللاجدوى.
الاكتشاف كمنتج مدفوع
سباق الاكتشاف ليس استشارة مجانية سابقة للتعاقد الحقيقي. بل هو منتج مدفوع بمُسلَّم محدد.
الحزمة المكوّنة من خمسة مخرجات، خريطة العملية وجرد البيانات وخريطة أصحاب القرار وتقدير القيمة وجرد المخاطر، ذات قيمة بغض النظر عن ما إذا كان سيتبعها مشروع ذكاء اصطناعي. مؤسسة أرادت أتمتة عملية واكتشفت في الأسبوع الثاني أن البيانات غير كافية قد وفّرت ميزانية مشروع امتد لاثني عشر شهراً. هذه نتيجة ملموسة، لا مقدمة.
تحديد نطاق الاكتشاف بحسب العملية لا بحسب معدل اليومية يُوافق الحوافز: المُسلَّم هو المخرج، لا الوقت المُنفَق. التعاقد اللاحق، إن حدث، يُحدَّد نطاقه من نتائج الاكتشاف، لا من الافتراضات الأولية التي ثبت جزئياً خطؤها.
العملاء الذين يرفضون الدفع مقابل الاكتشاف يميلون لأن يكونوا الأحوج إليه أكثر. الافتراض بأن كل شيء سيُتحقق منه خلال مرحلة البناء مكلف. الاكتشاف ينقل هذه التكلفة إلى نقطة في المشروع حيث تكون تكلفة اكتساب المعلومة في أدنى مستوياتها.
المخرجات الخمسة لسباق الاكتشاف تستحق أكثر قبل بداية البناء مما تستحق بعد الشهر السادس. النطاق يحدد ما يغطيه الاكتشاف؛ وخريطة العملية هي حيث تعيش معظم المفاجآت.
ذو صلة: الذكاء الاصطناعي الرأسي يفوز حيث يخفق الذكاء الاصطناعي العام وقطاعك لا يحتاج منصة ذكاء اصطناعي