الأدوار والمهام في عملية علوم بيانات الفريق

إن The Team Data Science Process (TDSP) عبارة عن إطار عمل تم تطويره بواسطة Microsoft ليوفر منهجية منظمة لبناء حلول تحليلات متوقعة وتطبيقات ذكية بكفاءة. توضح هذه المقالة أدوار الموظفين الرئيسية والمهام المرتبطة بها لفريق علوم البيانات الذي يعمل على توحيد هذه العملية.

يقترح بيئة متوافقة مع Git لتكملة البيانات الاصطناعية MLflow المخزنة في Azure التعلم الآلي. يتكامل Azure التعلم الآلي مع مستودعات Git، بحيث يمكنك استخدام العديد من الخدمات المتوافقة مع git، مثل GitHub أو GitLab أو Bitbucket أو Azure DevOps أو أي خدمة أخرى متوافقة مع Git.

بنية مجموعات وفرق علوم البيانات

غالباً ما يتم تنظيم وظائف علم البيانات في المؤسسات في التسلسل الهرمي التالي:

  • مجموعة علوم البيانات
  • فرق علوم البيانات داخل المجموعة

في مثل هذه البنية، هناك قيادات جماعية وقيادة فريق. عادة ما يقوم فريق علوم البيانات بتنفيذ مشروع علوم البيانات. تمتلك فرق علوم البيانات قادة المشروع لمهام إدارة المشروع والإدارة، وعلماء ومهندسي بيانات فرديين لأداء أجزاء علوم البيانات وهندسة البيانات في المشروع. يقوم العملاء المحتملون للمجموعة أو الفريق أو المشروع بتنفيذ الإعداد الأولي للمشروع والحوكمة.

تعريف ومهام لأربعة أدوار TDSP

مع افتراض أن وحدة علم البيانات تتكون من فرق داخل مجموعة، هناك أربعة أدوار مميزة لموظفي TDSP:

  • مدير المجموعة: يدير وحدة علم البيانات بأكملها في مؤسسة. قد تحتوي وحدة علوم البيانات على فرق متعددة، يعمل كل منها على مشاريع متعددة لعلوم البيانات في مجالات أعمال متميزة. قد يقوم مدير المجموعة بتفويض مهامه إلى بديل، ولكن المهام المقترنة بالدور لا تتغير.

  • قائد الفريق: يدير فريقا في وحدة علم البيانات في المؤسسة. يتكون الفريق من علماء البيانات. بالنسبة لوحدة صغيرة لعلوم البيانات، قد يكون مدير المجموعة وقيادة الفريق نفس الشخص.

  • قائد المشروع: يدير الأنشطة اليومية لعلماء البيانات الفرديين في مشروع معين لعلوم البيانات.

  • المساهمون الفرديون في المشروع: علماء البيانات ومحللي الأعمال ومهندسو البيانات والمهندسون المعماريون وغيرهم ممن ينفذون مشروع علوم البيانات.

إشعار

اعتمادا على بنية المؤسسة وحجمها، قد يكون لشخص واحد أكثر من دور واحد، أو قد يقوم أكثر من شخص واحد بملء دور.

المهام للأدوار الأربعة

يوضح الرسم التخطيطي التالي مهام المستوى الأعلى لكل دور TDSP. يمكن أن تساعدك هذه النظرة العامة والمخطط التفصيلي التالي للمهام لكل دور TDSP في اختيار البرنامج التعليمي الذي تحتاجه استنادا إلى مسؤولياتك.

Diagram that shows an overview of the roles and tasks.

مهام إدارة المجموعة

يكمل مدير المجموعة أو مسؤول نظام TDSP المعين المهام التالية لاعتماد TDSP:

  • تنشئ تنظيم Azure DevOps ومشروعاً جماعياً داخل المؤسسة.

  • ينشئ مستودع قوالب المشروع في مشروع مجموعة Azure DevOps، ويصنعه من مستودع قوالب المشروع الذي طوره فريق Microsoft TDSP. يوفر مستودع قوالب مشروع Microsoft TDSP ما يلي:

    • هيكل دليل قياسي ، بما في ذلك أدلة البيانات والتعليمة البرمجية والمستندات.
    • مجموعة من قوالب المستندات الموحدة لتوجيه عملية فعالة في علم البيانات.
  • ينشئ مستودعاً للأدوات المساعدة، ويزرعه من مستودع الأدوات الذي طوره فريق Microsoft TDSP. يوفر مستودع الأداة المساعدة TDSP من Microsoft مجموعة من الأدوات المساعدة المفيدة لجعل عمل عالم البيانات أكثر كفاءة. يتضمن مستودع الأدوات المساعدة من Microsoft أدوات مساعدة لاستكشاف البيانات وتحليلها وإعداد التقارير ووضع النماذج الأساسية وإعداد التقارير بشكل تفاعلي.

  • قم بإعداد نهج التحكم في الأمان لحساب المؤسسة.

لمزيد من المعلومات، راجع مهام مدير المجموعة لفريق علوم البيانات.

مهام قيادة الفريق

يكمل قائد الفريق أو مسؤول المشروع المعين المهام التالية لاعتماد TDSP:

  • ينشئ مشروعاً للفريق في مؤسسة Azure DevOps للمجموعة.

  • إنشاء مستودع قالب المشروع في المشروع، وزرعه من مستودع قالب مشروع المجموعة الذي أعده مدير المجموعة أو المفوض.

  • ينشئ مستودع الأدوات المساعدة للفريق ، ويصدره من مستودع أدوات المجموعة، ويضيف أدوات مساعدة خاصة بالفريق إلى المستودع.

  • ينشئ تخزين ملفات Azure اختيارياً لتخزين أصول البيانات المفيدة للفريق. يمكن لأعضاء الفريق الآخرين تحميل مخزن الملفات السحابي المشترك هذا على أجهزة سطح المكتب التحليلية الخاصة بهم.

  • تحميل تخزين ملفات Azure اختياريا على الجهاز الظاهري لعلوم البيانات للفريق وإضافة أصول بيانات الفريق إليه.

  • قم بإعداد التحكم في الأمان عن طريق إضافة أعضاء الفريق وتكوين أذوناتهم.

لمزيد من المعلومات، راجع مهام قيادة الفريق لفريق علوم البيانات.

المهام الرئيسية للمشروع

يكمل قائد المشروع المهام التالية لاعتماد TDSP:

  • يُنشئ مستودعاً للمشروع في مشروع الفريق، ويزرعه من مستودع قوالب المشروع.

  • ينشئ Azure file storage اختيارياً لتخزين أصول بيانات المشروع.

  • تحميل تخزين ملف Azure اختياريا إلى الجهاز الظاهري لعلوم البيانات وإضافة أصول بيانات المشروع إليه.

  • إعداد security control عن طريق إضافة أعضاء المشروع وتكوين أذوناتهم.

لمزيد من المعلومات، راجع مهام Project الرئيسية لفريق علوم البيانات.

مهام المساهم الفردية للمشروع

يقوم المساهم الفردي للمشروع، وهو عادة عالم بيانات، بتنفيذ المهام التالية باستخدام TDSP:

  • نسخ مستودع المشروع الذي تم إعداده بواسطة قائد المشروع.

  • يقوم اختياريا بتحميل الفريق المشترك ومشروع تخزين ملفات Azure على الجهاز الظاهري لعلوم البيانات.

  • ينفذ المشروع.

لمزيد من المعلومات، راجع Project individual contributor tasks لفريق علوم البيانات.

سير عمل تنفيذ مشروع علوم البيانات

يمكن لعلماء البيانات، والعملاء المتوقعين للمشروع، والعملاء المتوقعين للفريق إنشاء عناصر عمل لتعقب جميع المهام والمراحل للمشروع من البداية إلى النهاية. يوضح الشكل التالي سير عمل TDSP لتنفيذ المشروع:

Diagram that shows the typical data science project workflow.

يمكن تجميع خطوات سير العمل في ثلاثة أنشطة:

  • يقوم العملاء المتوقعون في المشروع بإجراء تخطيط الدورة المتكررة.

  • يطور علماء البيانات البيانات الاصطناعية على git الفروع لمعالجة عناصر العمل.

  • يقوم قادة المشروع أو أعضاء الفريق الآخرون بمراجعة التعليمات البرمجية ودمج فروع العمل في الفرع الأساسي.

المساهمون

تحتفظ Microsoft بهذه المقالة. وهي مكتوبة في الأصل من قبل المساهمين التاليين.

الكاتب الرئيسي:

لمشاهدة ملفات تعريف LinkedIn غير العامة، سجل الدخول إلى LinkedIn.