مشاركة عبر


تدريب نماذج التصنيف باستخدام AutoML Python API

توضح هذه المقالة كيفية تدريب نموذج باستخدام AutoML باستخدام واجهة برمجة تطبيقات AutoML Python. راجع مرجع AutoML Python API لمزيد من التفاصيل.

توفر واجهة برمجة التطبيقات وظائف لبدء التصنيف والانحدار والتنبؤ بتشغيل AutoML. كل استدعاء دالة يدرب مجموعة من النماذج وينشئ دفتر ملاحظات تجريبي لكل نموذج.

راجع متطلبات تجارب AutoML.

إعداد تجربة باستخدام واجهة برمجة تطبيقات AutoML

تصف الخطوات التالية بشكل عام كيفية إعداد تجربة AutoML باستخدام واجهة برمجة التطبيقات:

  1. إنشاء دفتر ملاحظات وإرفاقه بمجموعة تقوم بتشغيل Databricks Runtime ML.

  2. حدد الجدول الذي تريد استخدامه من مصدر البيانات الموجود أو قم بتحميل ملف بيانات إلى DBFS وأنشئ جدولا.

  3. لبدء تشغيل AutoML، استخدم الدالة automl.regress()automl.classify()، أو ، وقم automl.forecast() بتمرير الجدول، جنبا إلى جنب مع أي معلمات تدريب أخرى. لمشاهدة جميع الوظائف والمعلمات، راجع مرجع AutoML Python API.

    إشعار

    automl.forecast() تتوفر الدالة فقط للتنبؤ بالحوسبة الكلاسيكية.

    على سبيل المثال:

    # Regression example
    summary = automl.regress(dataset=train_pdf, target_col="col_to_predict")
    
    # Classification example
    summary = automl.classification(dataset=train_pdf, target_col="col_to_predict")
    
    # Forecasting example
    summary = automl.forecast(dataset=train_pdf, target_col="col_to_predic", time_col="date_col", horizon=horizon, frequency="d", output_database="default")
    
  4. عند بدء تشغيل AutoML، يظهر عنوان URL لتجربة MLflow في وحدة التحكم. استخدم عنوان URL هذا لمراقبة تقدم التشغيل. قم بتحديث تجربة MLflow لمشاهدة التجارب عند اكتمالها.

  5. بعد اكتمال تشغيل AutoML:

  • استخدم الارتباطات في ملخص الإخراج للانتقال إلى تجربة MLflow أو دفتر الملاحظات الذي أنشأ أفضل النتائج.
  • استخدم الارتباط إلى دفتر ملاحظات استكشاف البيانات للحصول على رؤى حول البيانات التي تم تمريرها إلى AutoML. يمكنك أيضا إرفاق دفتر الملاحظات هذا بنفس المجموعة وإعادة تشغيله لإعادة إنتاج النتائج أو إجراء تحليل بيانات إضافي.
  • استخدم كائن الملخص الذي تم إرجاعه من استدعاء AutoML لاستكشاف مزيد من التفاصيل حول التجارب أو لتحميل نموذج تم تدريبه بواسطة إصدار تجريبي معين. تعرف على المزيد حول كائن AutoMLSummary.
  • استنساخ أي دفتر ملاحظات تم إنشاؤه من الإصدارات التجريبية وإعادة تشغيله عن طريق إرفاقه بنفس المجموعة لإعادة إنتاج النتائج. يمكنك أيضا إجراء عمليات التحرير الضرورية وإعادة تشغيلها لتدريب نماذج إضافية وتسجيلها في نفس التجربة.

استيراد دفتر ملاحظات

لاستيراد دفتر ملاحظات محفوظ كأداة MLflow، استخدم databricks.automl.import_notebook واجهة برمجة تطبيقات Python. لمزيد من المعلومات، راجع استيراد دفتر الملاحظات

تسجيل نموذج ونشره

يمكنك تسجيل النموذج المدرب على AutoML ونشره تماما مثل أي نموذج مسجل في سجل نموذج MLflow؛ راجع تسجيل نماذج MLflow وتحميلها وتسجيلها ونشرها.

لا توجد وحدة نمطية مسماة pandas.core.indexes.numeric

عند تقديم نموذج تم إنشاؤه باستخدام AutoML مع خدمة النموذج، قد تحصل على الخطأ: No module named pandas.core.indexes.numeric.

ويرجع ذلك إلى إصدار غير متوافق pandas بين AutoML ونموذج خدمة بيئة نقطة النهاية. لحل الخطأ:

  1. قم بتنزيل البرنامج النصي add-pandas-dependency.py. يقوم البرنامج النصي بتحرير requirements.txt و conda.yaml للنموذج المسجل لتضمين إصدار التبعية المناسب: . pandas==1.5.3pandas
  2. تعديل البرنامج النصي لتضمين run_id تشغيل MLflow حيث تم تسجيل النموذج الخاص بك.
  3. إعادة تسجيل النموذج إلى سجل نموذج MLflow.
  4. حاول تقديم الإصدار الجديد من نموذج MLflow.

مثال دفتر الملاحظات

يوضح دفتر الملاحظات التالي كيفية إجراء التصنيف باستخدام AutoML.

مثال على دفتر ملاحظات تصنيف AutoML

الحصول على دفتر الملاحظات

الخطوات التالية

مرجع واجهة برمجة تطبيقات AutoML Python.