التشغيل السريع ل Python

MLflow هو نظام أساسي مصدر مفتوح لإدارة دورة حياة التعلم الآلي الشاملة. يوفر MLflow واجهات برمجة تطبيقات بسيطة لمقاييس التسجيل (على سبيل المثال، فقدان النموذج)، والمعلمات (على سبيل المثال، معدل التعلم)، والنماذج المجهزة، ما يجعل من السهل تحليل نتائج التدريب أو توزيع النماذج لاحقا.

في هذا القسم:

تثبيت MLflow

إذا كنت تستخدم Databricks Runtime التعلم الآلي، فإن MLflow مثبت بالفعل. وإلا، قم بتثبيت حزمة MLflow من PyPI.

تسجيل عمليات تشغيل التدريب تلقائيا إلى MLflow

باستخدام Databricks Runtime 10.4 LTS ML وما فوق، يتم تمكين Databricks Autologging بشكل افتراضي ويلتقط تلقائيا معلمات النموذج والمقاييس والملفات ومعلومات دورة الحياة عند تدريب النماذج من مجموعة متنوعة من مكتبات التعلم الآلي الشائعة.

مع Databricks Runtime 9.1 LTS ML، يوفر mlflow.<framework>.autolog() MLflow واجهات برمجة التطبيقات لتسجيل التعليمات البرمجية للتدريب تلقائيا المكتوبة في العديد من أطر عمل التعلم الآلي. يمكنك استدعاء واجهة برمجة التطبيقات هذه قبل تشغيل التعليمات البرمجية للتدريب لتسجيل المقاييس والمعلمات والبيانات الاصطناعية للنموذج الخاصة بالنموذج.

TensorFlow

إشعار

يتم أيضا دعم نماذج Keras في mlflow.tensorflow.autolog().

# Also autoinstruments tf.keras
import mlflow.tensorflow
mlflow.tensorflow.autolog()

XGBoost

import mlflow.xgboost
mlflow.xgboost.autolog()

LightGBM

import mlflow.lightgbm
mlflow.lightgbm.autolog()

scikit-learn

import mlflow.sklearn
mlflow.sklearn.autolog()

PySpark

إذا كان تنفيذ الضبط مع pyspark.ml، يتم تسجيل المقاييس والنماذج تلقائيا إلى MLflow. راجع Apache Spark MLlib وتتبع MLflow التلقائي.

عرض النتائج

بعد تنفيذ التعليمات البرمجية للتعلم الآلي، يمكنك عرض النتائج باستخدام الشريط الجانبي "تشغيل التجربة". راجع عرض تجربة دفتر الملاحظات للحصول على إرشادات حول كيفية عرض التجربة والتشغيل ومراجعة دفتر الملاحظات المستخدمة في التشغيل السريع.

تعقب المقاييس والمعلمات والنماذج الإضافية

يمكنك تسجيل معلومات إضافية عن طريق استدعاء واجهات برمجة تطبيقات تسجيل تتبع MLflow مباشرة.

المقاييس الرقمية

  import mlflow
  mlflow.log_metric("accuracy", 0.9)

معلمات التدريب

  import mlflow
  mlflow.log_param("learning_rate", 0.001)

النماذج

scikit-learn

 import mlflow.sklearn
 mlflow.sklearn.log_model(model, "myModel")

PySpark

 import mlflow.spark
 mlflow.spark.log_model(model, "myModel")

XGBoost

 import mlflow.xgboost
 mlflow.xgboost.log_model(model, "myModel")

TensorFlow

 import mlflow.tensorflow
 mlflow.tensorflow.log_model(model, "myModel")

Keras

 import mlflow.keras
 mlflow.keras.log_model(model, "myModel")

PyTorch

 import mlflow.pytorch
 mlflow.pytorch.log_model(model, "myModel")

دورة التباعد

 import mlflow.spacy
 mlflow.spacy.log_model(model, "myModel")

البيانات الاصطناعية الأخرى (الملفات)

   import mlflow
   mlflow.log_artifact("/tmp/my-file", "myArtifactPath")

مثال دفاتر الملاحظات

إشعار

باستخدام Databricks Runtime 10.4 LTS ML وما فوق، يتم تمكين Databricks Autologging بشكل افتراضي، ولا تكون التعليمات البرمجية في دفاتر الملاحظات هذه المثال مطلوبة. تم تصميم دفاتر الملاحظات المثال في هذا القسم للاستخدام مع Databricks Runtime 9.1 LTS ML.

الطريقة الموصى بها للبدء في استخدام تتبع MLflow مع Python هي استخدام واجهة برمجة تطبيقات MLflow autolog() . باستخدام إمكانات التسجيل التلقائي ل MLflow، يسجل سطر واحد من التعليمات البرمجية تلقائيا النموذج الناتج، والمعلمات المستخدمة لإنشاء النموذج، ودرجة النموذج. يوضح لك دفتر الملاحظات التالي كيفية إعداد تشغيل باستخدام التسجيل التلقائي.

دفتر ملاحظات Python للتشغيل التلقائي ل MLflow

الحصول على دفتر الملاحظات

إذا كنت بحاجة إلى مزيد من التحكم في المقاييس المسجلة لكل تشغيل تدريب، أو تريد تسجيل بيانات اصطناعية إضافية مثل الجداول أو المخططات، يمكنك استخدام وظائف واجهة برمجة تطبيقات تسجيل MLflow الموضحة في دفتر الملاحظات التالي.

دفتر ملاحظات Python لتسجيل MLflow لواجهة برمجة التطبيقات

الحصول على دفتر الملاحظات

معرفة المزيد