مرحلة فهم الأعمال لدورة حياة عملية علم بيانات الفريق

توضح هذه المقالة الأهداف والمهام والتسليمات التي ترتبط بمرحلة فهم الأعمال لعملية علم بيانات الفريق (TDSP). توفر هذه العملية دورة حياة موصى بها يمكن لفريقك استخدامها لهيكلة مشاريع علوم البيانات. توضح دورة الحياة المراحل الرئيسية التي يقوم بها فريقك، غالبا بشكل متكرر:

  • فهم الأعمال
  • اكتساب البيانات وفهمها
  • النمذجه
  • النشر
  • قبول العملاء

فيما يلي تمثيل مرئي لدورة حياة TDSP:

رسم تخطيطي يوضح مراحل دورة حياة TDSP.

الأهداف

أهداف مرحلة فهم الأعمال هي:

  • حدد المتغيرات الرئيسية التي تعمل كأهداف النموذج. وحدد مقاييس الأهداف، والتي تحدد نجاح المشروع.

  • تحديد مصادر البيانات ذات الصلة التي يمكن للأعمال الوصول إليها أو تحتاج إلى الحصول عليها.

كيفية إكمال المهام

مرحلة فهم الأعمال لها مهمتان رئيسيتان:

  • تحديد الأهداف: اعمل مع عميلك وأصحاب المصلحة الآخرين لفهم مشاكل العمل وتحديدها. صياغة الأسئلة التي تحدد أهداف الأعمال التي يمكن أن تستهدف تقنيات علم البيانات.

  • تحديد مصادر البيانات: ابحث عن البيانات ذات الصلة التي تساعدك على الإجابة عن الأسئلة التي تحدد أهداف المشروع.

تحديد الأهداف

  1. يتمثل الهدف الرئيسي لهذه المرحلة في تحديد متغيرات الأعمال الرئيسية التي يحتاج التحليل إلى التنبؤ بها. تسمى هذه المتغيرات أهداف النموذج، وتستخدم المقاييس المرتبطة بها لتحديد نجاح المشروع. على سبيل المثال، يمكن أن يكون الهدف تنبؤا بالمبيعات أو احتمال أن يكون الطلب احتياليا.

  2. لتحديد أهداف المشروع، اطرح الأسئلة الحادة ذات الصلة والمحددة وغير المبهمة وصقلها. علم البيانات هو عملية تستخدم الأسماء والأرقام للإجابة على مثل هذه الأسئلة. عادة ما تستخدم علم البيانات أو التعلم الآلي للإجابة على خمسة أنواع من الأسئلة:

    • كم أو كم؟ (الانحدار)
    • أي فئة؟ (التصنيف)
    • أي مجموعة؟ (أنظمة المجموعات)
    • هل هذا غير عادي؟ (الكشف عن الحالات الخارجة عن المألوف)
    • ما هو الخيار الذي ينبغي اتخاذه؟ (التوصية)

    حدد أي من هذه الأسئلة يجب طرحها وكيف يمكن أن تساعد الإجابة عليها في تحقيق أهداف عملك.

  3. لتحديد فريق المشروع، حدد أدوار ومسؤوليات أعضائه. تطوير خطة هامة رفيعة المستوى التي تقوم بالتكرير عليها عند اكتشاف المزيد من المعلومات.

  4. يجب تحديد مقاييس النجاح. على سبيل المثال، قد ترغب في تلبية توقع خسارة العملاء بمعدل دقة x بالمائة بنهاية مشروع لمدة ثلاثة أشهر. مع هذه البيانات، يمكنك تقديم عروض ترويجية للعملاء للحد من التخبط. يجب أن تكون المقاييس ذكية:

    • معين
    • قابل للقياس
    • قابل للتحقيق
    • ذو صلة
    • مرتبط بالوقت

تحديد مصادر البيانات

حدد مصادر البيانات التي تحتوي على أمثلة معروفة للإجابات على أسئلتك. ابحث عن البيانات التالية:

  • البيانات ذات الصلة بالسؤال. هل لديك مقاييس للهدف والميزات المرتبطة بالهدف؟
  • البيانات التي هي مقياس دقيق لهدف النموذج الخاص بك والميزات ذات الاهتمام.

على سبيل المثال، قد لا يحتوي النظام الحالي على البيانات التي يحتاجها لمعالجة مشكلة وتحقيق هدف مشروع. في هذه الحالة، قد تحتاج إلى العثور على مصادر بيانات خارجية أو تحديث أنظمتك لجمع بيانات جديدة.

التكامل مع MLflow

بالنسبة لمرحلة فهم الأعمال، لا يستخدم فريقك أدوات MLflow، ولكنه يمكن أن يستفيد بشكل غير مباشر من الوثائق وقدرات تتبع التجارب في MLflow. يمكن أن توفر هذه الميزات رؤى وسياقا تاريخيا للمساعدة في مواءمة المشروع مع أهداف العمل.

البيانات الاصطناعية

في هذه المرحلة، يقدم فريقك ما يلي:

  • وثيقة ميثاق. وثيقة الميثاق هي وثيقة حية. يمكنك تحديث المستند في جميع أنحاء المشروع أثناء إجراء اكتشافات جديدة ومع تغير متطلبات العمل. المفتاح هو التكرار على هذا المستند. أضف المزيد من التفاصيل أثناء تقدمك خلال عملية الاكتشاف. إبلاغ العميل وأصحاب المصلحة الآخرين بالتغييرات وأسبابها.

  • مصادر البيانات. يمكنك استخدام Azure التعلم الآلي للتعامل مع إدارة مصدر البيانات. نوصي بخدمة Azure هذه للمشاريع النشطة والكبيرة بشكل خاص لأنها تتكامل مع MLflow.

  • قواميس البيانات. يوفر هذا المستند أوصافا للبيانات التي يوفرها العميل. تتضمن هذه الأوصاف معلومات حول المخطط (أنواع البيانات والمعلومات المتعلقة بقواعد التحقق من الصحة، إن وجدت) والرسوم البيانية للعلاقات بين الكيانين، إذا كانت متوفرة. يجب على فريقك توثيق بعض هذه المعلومات أو كلها.

أدب مراجع من قبل الأقران

ينشر الباحثون دراسات حول TDSP في الأدب الذي يراجعه الأقران. توفر الاقتباسات فرصة للتحقيق في تطبيقات أخرى أو أفكار مشابهة ل TDSP، بما في ذلك مرحلة دورة حياة فهم الأعمال.

المساهمون

تحتفظ Microsoft بهذه المقالة. وهي مكتوبة في الأصل من قبل المساهمين التاليين.

الكاتب الرئيسي:

لمشاهدة ملفات تعريف LinkedIn غير العامة، سجل الدخول إلى LinkedIn.

تصف هذه المقالات المراحل الأخرى من دورة حياة TDSP: