نموذج الاستحقاق الخاص بعمليات التعلم الآلي من Microsoft Azure

Azure Machine Learning

الهدف من نموذج النضج هذا هو المساعدة في توضيح مبادئ وممارسات عمليات التعلم الآلي (MLOps). يظهر نموذج النضج التحسين المتواصل في إنشاء وتشغيل بيئة تطبيق التعلم الآلي على مستوى الإنتاج. يمكنك استخدامه كمقياس لتأسيس المتطلبات التدريجية المطلوبة لقياس نضج بيئة إنتاج التعلم الآلي والعمليات المرتبطة بها.

نموذج الاستحقاق

يعمل نموذج نضج MLOps على توضيح مبادئ وممارسات عمليات التطوير (DevOps) اللازمة لتشغيل بيئة MLOps ناجحة. والهدف منه تحديد الثغرات في محاولة المؤسسة الحالية لتنفيذ مثل هذه البيئة. كما أنها طريقة توضح لك طريقة تنمية قدرة MLOps الخاصة بك بزيادات بدلا من إغراقك بمتطلبات بيئة ناضجة بالكامل. استخدمه بصفته دليل لـ:

  • تقدير نطاق العمل للتفاعلات الجديدة.

  • وضع معايير النجاح الواقعية.

  • حدد التسليمات التي تسلمها في نهاية التفاعل.

كما هو الحال مع أغلبية نماذج النضج، يقيم نموذج نضج MLOps الأشخاص/الثقافة والعمليات/الهياكل والعناصر/التكنولوجيا نوعيا. مع الزيادة في مستوى النضج، يزيد الاحتمال من أن تؤدي الحوادث أو الأخطاء إلى تحسينات في جودة عمليات التطوير والإنتاج.

يحتوي نموذج نضج MLOps خمسة مستويات من القدرة التقنية:

المستوى ‏‏الوصف النقاط الرئيسية التقنية
0 لا تتوفر عمليات MLOps
  • ليس من السهل إدارة دورة حياة نموذج التعلم الآلي الكامل
  • بسبب الفرق المتباينة والإصدارات المؤلمة
  • توجد معظم الأنظمة "كمربعات سوداء"، القليل من الملاحظات أثناء النشر/والتوزيع
  • البنيات والتوزيعات اليدوية
  • الاختبار اليدوي الخاص بالنموذج والتطبيق
  • لا يوجد تتبع مركزي للأداء الخاصة بالنموذج
  • تدريب النموذج اليدوي
1 DevOps ولكن لا تتوفر عمليات MLOps
  • تعد الإصدارات أقل إيلاما من No MLOps، ولكنها تعتمد على فريق البيانات لكل نموذج جديد
  • لا تزال التعليقات محدودة حول مدى جودة الأداء الخاص بالنموذج في الإنتاج
  • ليس من السهل تتبع/إعادة إنتاج النتائج
  • البنية التلقائية
  • الاختبارات التلقائية للتعليمات البرمجية الخاصة بالتطبيق
2 التدريب التلقائي
  • تتم إدارة بيئة التدريب بشكل كامل وتتبعها
  • من السهل إعادة عملية إنتاج النموذج
  • الإصدارات يدوية، ولكنها ذات احتكاك منخفض
  • نموذج التدريب التلقائي
  • التتبع المركزي للأداء الخاصة بتدريب النموذج
  • إدارة النماذج
3 توزيع النموذج التلقائي
  • الإصدارات منخفضة الاحتكاك وتلقائية
  • إمكانية التتبع الكامل من التوزيع مرة أخرى إلى البيانات الأصلية
  • بيئة كاملة مدارة: تدريب > إنتاج الاختبار >
  • اختبار A/B المتكامل لأداء النموذج للتوزيع
  • الاختبارات التلقائية لكافة التعليمات البرمجية
  • التتبع المركزي للأداء الخاصة بتدريب النموذج
4 عمليات MLOps التلقائية الكاملة
  • النظام الكامل التلقائي ومراقبته بسهولة
  • توفر أنظمة الإنتاج معلومات حول طريقة تحسين النماذج الجديدة وتحسينها تلقائيا في بعض الحالات
  • الاقتراب من نظام وقت تعطل صفري
  • نموذج التدريب والاختبار التلقائي
  • مقاييس مطولة ومركزية من النموذج الموزع

تحدد الجداول التالية الخصائص التفصيلية لهذا المستوى الخاص بنضج العملية. وسيواصل النموذج في التطور. تم آخر تحديث لهذا الإصدار في شهر يناير 2020.

المستوى 0: لا تتوفر عمليات MLOps

الأشخاص عملية إنشاء النموذج عملية إصدار النموذج عملية تكامل التطبيقات
  • يعد علماء البيانات: منعزلون، وليس في اتصالات منتظمة مع الفريق الأكبر
  • مهندسو البيانات (في حالة كان موجودا): منعزلين، وليس في اتصال منتظم مع الفريق الأكبر
  • وكذلك مهندسو البرمجيات: منعزلون، يتلقون النموذج عن بعد من أعضاء الفريق الآخرين
  • البيانات التي جمعت يدويا
  • من المتوقع ألا تتم إدارة الحساب
  • لا يتم تعقب التجارب بطريقة متوقعة
  • قد تكون النتيجة النهائية ملف نموذج واحد يتم تسليمه يدويا مع المدخلات/ المخرجات
  • العملية اليدوية
  • قد يتم إنشاء البرنامج النصي لتسجيل النقاط يدويا بشكل جيد بعد التجارب، وليس التحكم في الإصدار
  • الإصدار الذي يعالجه عالم البيانات أو مهندس البيانات بمفرده
  • يعتمد بصفة كبيرة على خبرة عالم البيانات لتنفيذها
  • الإصدارات اليدوية في كل مرة

المستوى الأول: DevOps no MLOps

الأشخاص عملية إنشاء النموذج عملية إصدار النموذج عملية تكامل التطبيقات
  • يعد علماء البيانات: منعزلون، وليس في اتصالات منتظمة مع الفريق الأكبر
  • مهندسو البيانات (في حالة كان موجودا): منعزلين، وليس في اتصال منتظم مع الفريق الأكبر
  • وكذلك مهندسو البرمجيات: منعزلون، يتلقون النموذج عن بعد من أعضاء الفريق الآخرين
  • تجمع البنية الأساسية لبرنامج ربط العمليات التجارية للبيانات البيانات بطريقة تلقائية
  • الحساب في حالة كان مدار أو غير مدار
  • لا يتم تعقب التجارب بطريقة متوقعة
  • قد تكون النتيجة النهائية ملف نموذج واحد يتم تسليمه يدويا مع المدخلات/ المخرجات
  • العملية اليدوية
  • قد يتم إنشاء البرنامج النصي لتسجيل النقاط يدويا بشكل جيد بعد التجارب، من المحتمل أن يتم التحكم في الإصدار
  • ويتم تسليمها إلى مهندسي البرمجيات
  • توجد اختبارات التكامل الرئيسية للنموذج
  • يعتمد بصفة كبيرة على خبرة عالم البيانات لتنفيذ النموذج
  • إصدارات تلقائية
  • تحتوي التعليمة البرمجية الخاصة بالتطبيق على اختبارات الوحدة

المستوى الثاني: التدريب التلقائي

الأشخاص عملية إنشاء النموذج عملية إصدار النموذج عملية تكامل التطبيقات
  • علماء البيانات: العمل مباشرة مع مهندسي البيانات لتحويل التعليمات البرمجية للتجريب إلى البرامج النصية/الوظائف القابلة للتكرار
  • مهندسو البيانات: العمل والتعاون مع علماء البيانات
  • وكذلك مهندسو البرمجيات: منعزلون، يتلقون النموذج عن بعد من أعضاء الفريق الآخرين
  • تجمع البنية الأساسية لبرنامج ربط العمليات التجارية للبيانات البيانات بطريقة تلقائية
  • حساب مدار
  • النتائج الخاصة بالتجربة المتعقبة
  • يتم التحكم في كل من التعليمات البرمجية الخاصة بالتدريب والنماذج الناتجة
  • الإصدار اليدوي
  • يتم التحكم في البرنامج النصي الخاص بتسجيل النقاط باستخدام الاختبارات
  • الإصدار الذي يتم إدارته بواسطة فريق هندسة البرمجيات
  • توجد اختبارات التكامل الرئيسية للنموذج
  • يعتمد بصفة كبيرة على خبرة عالم البيانات لتنفيذ النموذج
  • تحتوي التعليمة البرمجية الخاصة بالتطبيق على اختبارات الوحدة

المستوى الثالث: توزيع النموذج التلقائي

الأشخاص عملية إنشاء النموذج عملية إصدار النموذج عملية تكامل التطبيقات
  • علماء البيانات: العمل مباشرة مع مهندسي البيانات لتحويل التعليمات البرمجية للتجريب إلى البرامج النصية/الوظائف القابلة للتكرار
  • يقوم مهندسو البيانات: بالعمل مع علماء البيانات ومهندسي البرمجيات لإدارة المدخلات/المخرجات
  • مهندسو البرمجيات: العمل والتعاون مع مهندسي البيانات لأتمتة تكامل النموذج في التعليمات البرمجية للتطبيق
  • تجمع البنية الأساسية لبرنامج ربط العمليات التجارية للبيانات البيانات بطريقة تلقائية
  • حساب مدار
  • النتائج الخاصة بالتجربة المتعقبة
  • يتم التحكم في كل من التعليمات البرمجية الخاصة بالتدريب والنماذج الناتجة
  • إصدار تلقائي
  • يتم التحكم في البرنامج النصي الخاص بتسجيل النقاط باستخدام الاختبارات
  • الإصدار المدار بواسطة البنية الأساسية لبرنامج ربط العمليات التجارية التسليم المستمر (CI/CD)
  • اختبارات الوحدة والتكامل لكل إصدار خاص بالنموذج
  • يعتمد بصفة أقل على خبرة عالم البيانات لتنفيذ النموذج
  • تحتوي التعليمة البرمجية الخاصة بالتطبيق على اختبارات الوحدة/التكامل

المستوى الرابع: إعادة التدريب التلقائي الكامل لـ MLOps

الأشخاص عملية إنشاء النموذج عملية إصدار النموذج عملية تكامل التطبيقات
  • يقوم علماء البيانات: بالعمل مباشرة مع مهندسي البيانات لتحويل تعليمة التجريب البرمجية إلى برامج نصية/وظائف قابلة للتكرار. العمل مع مهندسي البرمجيات لتحديد العلامات الخاصة بمهندسي البيانات
  • يقوم مهندسو البيانات: بالعمل مع علماء البيانات ومهندسي البرمجيات لإدارة المدخلات/المخرجات
  • يقوم مهندسو البرمجيات: بالعمل مع مهندسي البيانات لأتمتة تكامل النموذج في التعليمات البرمجية للتطبيق. تنفيذ جمع المقاييس ما بعد التوزيع
  • تجمع البنية الأساسية لبرنامج ربط العمليات التجارية للبيانات البيانات بطريقة تلقائية
  • إعادة التدريب التي يتم تشغيلها بطريقة تلقائية استنادا إلى مقاييس الإنتاج
  • حساب مدار
  • النتائج الخاصة بالتجربة المتعقبة
  • يتم التحكم في كل من التعليمات البرمجية الخاصة بالتدريب والنماذج الناتجة
  • إصدار تلقائي
  • يتم التحكم في البرنامج النصي لتسجيل النقاط باستخدام الاختبارات
  • الإصدار المدار من قبل التكامل المستمر والبنية الأساسية لبرنامج ربط العمليات التجارية CI/CD
  • اختبارات الوحدة والتكامل لكل إصدار خا ص بالنموذج
  • يعتمد بصفة أقل على خبرة عالم البيانات لتنفيذ النموذج
  • تحتوي التعليمة البرمجية الخاصة بالتطبيق على اختبارات الوحدة/التكامل

الخطوات التالية