automl الحزمة

يحتوي على فئات التعلم الآلي المؤتمتة ل Azure Machine Learning SDKv2.

تتضمن المجالات الرئيسية إدارة مهام AutoML.

الفصول

ClassificationJob

تكوين مهمة تصنيف AutoML.

تهيئة مهمة تصنيف AutoML جديدة.

ColumnTransformer

إعدادات محول العمود.

ForecastingJob

تكوين مهمة التنبؤ ب AutoML.

تهيئة مهمة تنبؤ AutoML جديدة.

ForecastingSettings

إعدادات التنبؤ لوظيفة AutoML.

ImageClassificationJob

تكوين مهمة تصنيف الصور متعددة الفئات ل AutoML.

تهيئة مهمة AutoML جديدة متعددة الفئات لتصنيف الصور.

ImageClassificationMultilabelJob

تكوين مهمة تصنيف الصور متعددة التسميات ل AutoML.

تهيئة مهمة AutoML جديدة متعددة التسميات لتصنيف الصور.

ImageClassificationSearchSpace

ابحث عن مساحة لتصنيف صور AutoML وتصنيف الصور متعدد المهام.

ImageInstanceSegmentationJob

تكوين مهمة تجزئة مثيل صورة AutoML.

تهيئة مهمة تجزئة مثيل صورة AutoML جديدة.

ImageLimitSettings

تحديد إعدادات AutoML Image Verticals.

ImageLimitSettings هي فئة تحتوي على المعلمات التالية: max_concurrent_trials max_trials timeout_minutes.

هذه طريقة تكوين اختيارية لتكوين معلمات الحدود مثل المهلات وما إلى ذلك.

ملاحظة

يتم تحديد عدد عمليات التشغيل المتزامنة على الموارد المتاحة في هدف الحساب المحدد.

تأكد من أن الهدف الحسابي لديه الموارد المتاحة للتزامن المطلوب.

تلميح

من الممارسات الجيدة مطابقة عدد max_concurrent_trials مع عدد العقد في نظام المجموعة.

على سبيل المثال، إذا كان لديك نظام مجموعة مع 4 عقد، فقم بتعيين max_concurrent_trials إلى 4.

استخدام المثال

تكوين ImageLimitSettings


   from azure.ai.ml import automl

   # Create the AutoML job with the related factory-function.
   image_instance_segmentation_job = automl.image_instance_segmentation(
       compute=compute_name,
       experiment_name=exp_name,
       training_data=my_training_data_input,
       validation_data=my_validation_data_input,
       target_column_name="label",
       primary_metric="MeanAveragePrecision",
       tags={"my_custom_tag": "custom value"},
   )
   # Set the limits for the AutoML job.
   image_instance_segmentation_job.set_limits(
       max_trials=10,
       max_concurrent_trials=2,
   )
   # Submit the AutoML job.
   image_instance_segmentation_job.submit()

تهيئة كائن ImageLimitSettings.

الدالة الإنشائية ل ImageLimitSettings ل AutoML Image Verticals.

ImageModelSettingsClassification

إعدادات النموذج لمهام تصنيف صور AutoML.

ImageModelSettingsObjectDetection

إعدادات النموذج لمهمة الكشف عن كائن صورة AutoML.

ImageObjectDetectionJob

تكوين مهمة AutoML Image Object Detection.

تهيئة مهمة AutoML Image Object Detection جديدة.

ImageObjectDetectionSearchSpace

مساحة البحث عن مهام الكشف عن كائن صورة AutoML وتجزئة مثيل الصورة.

ImageSweepSettings

إعدادات المسح لجميع أعموديات صور AutoML.

NlpFeaturizationSettings

إعدادات التمييز لجميع أعموديات NLP الخاصة ب AutoML.

NlpFixedParameters

كائن لإيواء معلمات ثابتة لوظائف NLP.

NlpLimitSettings

تحديد الإعدادات لكافة القطاعات العمودية ل AutoML NLP.

NlpSearchSpace

ابحث عن مساحة لمهام AutoML NLP.

NlpSweepSettings

إعدادات المسح لجميع مهام AutoML NLP.

RegressionJob

تكوين مهمة انحدار AutoML.

تهيئة مهمة انحدار AutoML جديدة.

SearchSpace

فئة SearchSpace لعموديات AutoML.

StackEnsembleSettings

إعداد مسبق لتخصيص تشغيل StackEnsemble.

TabularFeaturizationSettings

إعدادات التمييز لوظيفة AutoML.

TabularLimitSettings

تحديد الإعدادات لعموديات جدول AutoML.

TextClassificationJob

تكوين مهمة تصنيف نص AutoML.

تهيئة مهمة تصنيف نص AutoML جديدة.

TextClassificationMultilabelJob

تكوين مهمة Multilabel لتصنيف نص AutoML.

تهيئة مهمة AutoML Text Classification Multilabel جديدة.

TextNerJob

تكوين مهمة NER لنص AutoML.

تهيئة مهمة AutoML Text NER جديدة.

TrainingSettings

فئة TrainingSettings للتعلم الآلي من Microsoft Azure.

فئة TrainingSettings للتعلم الآلي من Microsoft Azure.

التعدادات

BlockedTransformers

تعداد لجميع نماذج التصنيف التي يدعمها AutoML.

ClassificationModels

تعداد لجميع نماذج التصنيف التي يدعمها AutoML.

ClassificationMultilabelPrimaryMetrics

المقاييس الأساسية لتصنيف المهام متعددة التسميات.

ClassificationPrimaryMetrics

المقاييس الأساسية لمهام التصنيف.

FeaturizationMode

وضع التمييز - يحدد وضع تمييز البيانات.

ForecastHorizonMode

تعداد لتحديد وضع تحديد أفق التنبؤ.

ForecastingModels

تعداد لجميع نماذج التنبؤ التي يدعمها AutoML.

ForecastingPrimaryMetrics

المقاييس الأساسية لمهمة التنبؤ.

InstanceSegmentationPrimaryMetrics

المقاييس الأساسية لمهام InstanceSegmentation.

LearningRateScheduler

قائمة تعداد جدولة معدل التعلم.

LogTrainingMetrics

يحتوي على فئات التعلم الآلي المؤتمتة ل Azure Machine Learning SDKv2.

تتضمن المجالات الرئيسية إدارة مهام AutoML.

LogValidationLoss

يحتوي على فئات التعلم الآلي المؤتمتة ل Azure Machine Learning SDKv2.

تتضمن المجالات الرئيسية إدارة مهام AutoML.

NCrossValidationsMode

تحديد كيفية تحديد قيمة عمليات التحقق من الصحة N-Cross.

ObjectDetectionPrimaryMetrics

المقاييس الأساسية لمهمة Image ObjectDetection.

RegressionModels

تعداد لجميع نماذج الانحدار التي يدعمها AutoML.

RegressionPrimaryMetrics

المقاييس الأساسية لمهمة الانحدار.

SamplingAlgorithmType

يحتوي على فئات التعلم الآلي المؤتمتة ل Azure Machine Learning SDKv2.

تتضمن المجالات الرئيسية إدارة مهام AutoML.

ShortSeriesHandlingConfiguration

المعلمة التي تحدد كيفية معالجة AutoML للسلاسل الزمنية القصيرة.

StochasticOptimizer

محسن Stochastic لنماذج الصور.

TargetAggregationFunction

الدالة التجميعية الهدف.

TargetLagsMode

أوضاع تحديد التأخر المستهدفة.

TargetRollingWindowSizeMode

وضع حجم النوافذ المتداول الهدف.

UseStl

تكوين تحليل STL لعمود هدف السلسلة الزمنية.

ValidationMetricType

أسلوب حساب القياس لاستخدامه لمقاييس التحقق من الصحة في مهام الصورة.

الوظائف

classification

دالة لإنشاء ClassificationJob.

يتم استخدام مهمة التصنيف لتدريب نموذج يتنبأ بشكل أفضل بفئة عينة البيانات. يتم تدريب نماذج مختلفة باستخدام بيانات التدريب. يتم تحديد النموذج الذي يحتوي على أفضل أداء على بيانات التحقق من الصحة استنادا إلى المقياس الأساسي كنموذج نهائي.

classification(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> ClassificationJob

المعلمات

training_data
Input

بيانات التدريب التي سيتم استخدامها داخل التجربة. يجب أن يحتوي على كل من ميزات التدريب وعمود التسمية (اختياريا عمود أوزان العينة).

target_column_name
str

اسم عمود التسمية. تنطبق هذه المعلمة على training_datavalidation_data المعلمات و test_data

primary_metric

المقياس الذي سيحسنه التعلم الآلي التلقائي لاختيار النموذج. يجمع التعلم الآلي التلقائي مقاييس أكثر مما يمكن تحسينه. لمزيد من المعلومات حول كيفية حساب المقاييس، راجع https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

القيم المقبولة: الدقة AUC_weighted norm_macro_recall average_precision_score_weighted والإعدادات الافتراضية precision_score_weighted إلى الدقة

enable_model_explainability
bool

ما إذا كان سيتم تمكين شرح أفضل نموذج AutoML في نهاية جميع تكرارات تدريب AutoML. الإعداد الافتراضي هو لا شيء. لمزيد من المعلومات، راجع قابلية التفسير: تفسيرات النموذج في التعلم الآلي التلقائي.

weight_column_name
str

اسم عمود وزن العينة. يدعم التعلم الآلي التلقائي عمودا مرجحا كإدخل، ما يتسبب في ترجيح الصفوف في البيانات لأعلى أو لأسفل. إذا كانت بيانات الإدخال من pandas. DataFrame الذي لا يحتوي على أسماء أعمدة، يمكن استخدام مؤشرات الأعمدة بدلا من ذلك، مع التعبير عنها كأعداد صحيحة.

هذه المعلمة قابلة للتطبيق على training_data المعلمات و validation_data

validation_data
Input

بيانات التحقق من الصحة التي سيتم استخدامها داخل التجربة. يجب أن يحتوي على كل من ميزات التدريب وعمود التسمية (اختياريا عمود أوزان العينة).

الإعدادات الافتراضية إلى بلا

validation_data_size
float

ما هو جزء البيانات المطلوب الاحتفاظ به للتحقق من الصحة عند عدم تحديد بيانات التحقق من صحة المستخدم. يجب أن يكون هذا بين 0.0 و1.0 غير شامل.

حدد validation_data لتوفير بيانات التحقق من الصحة، أو تعيين n_cross_validations أو validation_data_size لاستخراج بيانات التحقق من الصحة من بيانات التدريب المحددة. بالنسبة إلى طية التحقق المقطعي المخصصة، استخدم cv_split_column_names.

لمزيد من المعلومات، راجع تكوين تقسيمات البيانات والتحقق المتبادل في التعلم الآلي التلقائي.

الإعدادات الافتراضية إلى بلا

n_cross_validations
Union[str, int]

كم عدد عمليات التحقق المتقاطعة التي يجب إجراؤها عند عدم تحديد بيانات التحقق من صحة المستخدم.

حدد validation_data لتوفير بيانات التحقق من الصحة، أو تعيين n_cross_validations أو validation_data_size لاستخراج بيانات التحقق من الصحة من بيانات التدريب المحددة. بالنسبة إلى طية التحقق المقطعي المخصصة، استخدم cv_split_column_names.

لمزيد من المعلومات، راجع تكوين تقسيمات البيانات والتحقق المتبادل في التعلم الآلي التلقائي.

الإعدادات الافتراضية إلى بلا

cv_split_column_names
List[str]

قائمة بأسماء الأعمدة التي تحتوي على تقسيم مخصص للتحقق من الصحة المتقاطع. يمثل كل عمود من أعمدة تقسيم CV تقسيم سيرة ذاتية واحد حيث يتم وضع علامة على كل صف إما 1 للتدريب أو 0 للتحقق من الصحة.

الإعدادات الافتراضية إلى بلا

test_data
Input

ميزة اختبار النموذج باستخدام مجموعات بيانات الاختبار أو تقسيم بيانات الاختبار هي ميزة في حالة المعاينة وقد تتغير في أي وقت. بيانات الاختبار التي سيتم استخدامها لتشغيل اختبار سيتم بدء تشغيله تلقائيا بعد اكتمال تدريب النموذج. سيحصل تشغيل الاختبار على تنبؤات باستخدام أفضل نموذج وسيحسب المقاييس نظرا لهذه التنبؤات.

إذا لم يتم تحديد هذه المعلمة أو المعلمة test_data_size ، فلن يتم تنفيذ أي تشغيل اختبار تلقائيا بعد اكتمال تدريب النموذج. يجب أن تحتوي بيانات الاختبار على كل من الميزات وعمود التسمية. إذا test_data تم تحديد ثم target_column_name يجب تحديد المعلمة.

الإعدادات الافتراضية إلى بلا

test_data_size
float

ميزة اختبار النموذج باستخدام مجموعات بيانات الاختبار أو تقسيم بيانات الاختبار هي ميزة في حالة المعاينة وقد تتغير في أي وقت. ما هو جزء من بيانات التدريب التي يجب الاحتفاظ بها لبيانات الاختبار لتشغيل اختبار سيتم تشغيله تلقائيا بعد اكتمال تدريب النموذج. سيحصل تشغيل الاختبار على تنبؤات باستخدام أفضل نموذج وسيحسب المقاييس نظرا لهذه التنبؤات.

يجب أن يكون هذا بين 0.0 و1.0 غير شامل. إذا test_data_size تم تحديد في نفس الوقت مثل validation_data_size، فسيتم تقسيم بيانات الاختبار من قبل تقسيم بيانات التحقق من training_data الصحة. على سبيل المثال، إذا كانت validation_data_size=0.1test_data_size=0.1 بيانات التدريب الأصلية تحتوي على 1000 صف، فسيكون لبيانات الاختبار 100 صف، وستحتوي بيانات التحقق من الصحة على 90 صفا وسيكون لبيانات التدريب 810 صفوف.

بالنسبة للمهام المستندة إلى الانحدار، يتم استخدام أخذ العينات العشوائية. بالنسبة لمهام التصنيف، يتم استخدام أخذ العينات الطبقية. لا يدعم التنبؤ حاليا تحديد مجموعة بيانات اختبار باستخدام تقسيم تدريب/اختبار.

إذا لم يتم تحديد هذه المعلمة أو المعلمة test_data ، فلن يتم تنفيذ أي تشغيل اختبار تلقائيا بعد اكتمال تدريب النموذج.

الإعدادات الافتراضية إلى بلا

المرتجعات

كائن مهمة يمكن إرساله إلى حساب التعلم الآلي من Microsoft Azure للتنفيذ.

نوع الإرجاع

forecasting

دالة لإنشاء مهمة تنبؤ.

يتم استخدام مهمة التنبؤ للتنبؤ بالقيم المستهدفة لفترة زمنية مستقبلية استنادا إلى البيانات التاريخية. يتم تدريب نماذج مختلفة باستخدام بيانات التدريب. يتم تحديد النموذج الذي يحتوي على أفضل أداء على بيانات التحقق من الصحة استنادا إلى المقياس الأساسي كنموذج نهائي.

forecasting(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, forecasting_settings: ForecastingSettings | None = None, **kwargs) -> ForecastingJob

المعلمات

training_data
Input

بيانات التدريب التي سيتم استخدامها داخل التجربة. يجب أن يحتوي على كل من ميزات التدريب وعمود التسمية (اختياريا عمود أوزان العينة).

target_column_name
str

اسم عمود التسمية. تنطبق هذه المعلمة على training_datavalidation_data المعلمات و test_data

primary_metric

المقياس الذي سيحسنه التعلم الآلي التلقائي لاختيار النموذج. يجمع التعلم الآلي التلقائي مقاييس أكثر مما يمكن تحسينه. لمزيد من المعلومات حول كيفية حساب المقاييس، راجع https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

القيم المقبولة: r2_score أو normalized_mean_absolute_error أو الإعدادات الافتراضية normalized_root_mean_squared_error normalized_root_mean_squared_error

enable_model_explainability
bool

ما إذا كان سيتم تمكين شرح أفضل نموذج AutoML في نهاية جميع تكرارات تدريب AutoML. الإعداد الافتراضي هو لا شيء. لمزيد من المعلومات، راجع قابلية التفسير: تفسيرات النموذج في التعلم الآلي التلقائي.

weight_column_name
str

اسم عمود وزن العينة. يدعم التعلم الآلي التلقائي عمودا مرجحا كإدخل، ما يتسبب في ترجيح الصفوف في البيانات لأعلى أو لأسفل. إذا كانت بيانات الإدخال من pandas. DataFrame الذي لا يحتوي على أسماء أعمدة، يمكن استخدام مؤشرات الأعمدة بدلا من ذلك، مع التعبير عنها كأعداد صحيحة.

هذه المعلمة قابلة للتطبيق على training_data المعلمات و validation_data

validation_data
Input

بيانات التحقق من الصحة التي سيتم استخدامها داخل التجربة. يجب أن يحتوي على كل من ميزات التدريب وعمود التسمية (اختياريا عمود أوزان العينة).

الإعدادات الافتراضية إلى بلا

validation_data_size
float

ما هو جزء البيانات المطلوب الاحتفاظ به للتحقق من الصحة عند عدم تحديد بيانات التحقق من صحة المستخدم. يجب أن يكون هذا بين 0.0 و1.0 غير شامل.

حدد validation_data لتوفير بيانات التحقق من الصحة، أو تعيين n_cross_validations أو validation_data_size لاستخراج بيانات التحقق من الصحة من بيانات التدريب المحددة. بالنسبة إلى طية التحقق المقطعي المخصصة، استخدم cv_split_column_names.

لمزيد من المعلومات، راجع تكوين تقسيمات البيانات والتحقق المتبادل في التعلم الآلي التلقائي.

الإعدادات الافتراضية إلى بلا

n_cross_validations
Union[str, int]

كم عدد عمليات التحقق المتقاطعة التي يجب إجراؤها عند عدم تحديد بيانات التحقق من صحة المستخدم.

حدد validation_data لتوفير بيانات التحقق من الصحة، أو تعيين n_cross_validations أو validation_data_size لاستخراج بيانات التحقق من الصحة من بيانات التدريب المحددة. بالنسبة إلى طية التحقق المقطعي المخصصة، استخدم cv_split_column_names.

لمزيد من المعلومات، راجع تكوين تقسيمات البيانات والتحقق المتبادل في التعلم الآلي التلقائي.

الإعدادات الافتراضية إلى بلا

cv_split_column_names
List[str]

قائمة بأسماء الأعمدة التي تحتوي على تقسيم مخصص للتحقق من الصحة المتقاطع. يمثل كل عمود من أعمدة تقسيم CV تقسيم سيرة ذاتية واحد حيث يتم وضع علامة على كل صف إما 1 للتدريب أو 0 للتحقق من الصحة.

الإعدادات الافتراضية إلى بلا

test_data
Input

ميزة اختبار النموذج باستخدام مجموعات بيانات الاختبار أو تقسيم بيانات الاختبار هي ميزة في حالة المعاينة وقد تتغير في أي وقت. بيانات الاختبار التي سيتم استخدامها لتشغيل اختبار سيتم بدء تشغيله تلقائيا بعد اكتمال تدريب النموذج. سيحصل تشغيل الاختبار على تنبؤات باستخدام أفضل نموذج وسيحسب المقاييس نظرا لهذه التنبؤات.

إذا لم يتم تحديد هذه المعلمة أو المعلمة test_data_size ، فلن يتم تنفيذ أي تشغيل اختبار تلقائيا بعد اكتمال تدريب النموذج. يجب أن تحتوي بيانات الاختبار على كل من الميزات وعمود التسمية. إذا test_data تم تحديد ثم target_column_name يجب تحديد المعلمة.

الإعدادات الافتراضية إلى بلا

test_data_size
float

ميزة اختبار النموذج باستخدام مجموعات بيانات الاختبار أو تقسيم بيانات الاختبار هي ميزة في حالة المعاينة وقد تتغير في أي وقت. ما هو جزء من بيانات التدريب التي يجب الاحتفاظ بها لبيانات الاختبار لتشغيل اختبار سيتم تشغيله تلقائيا بعد اكتمال تدريب النموذج. سيحصل تشغيل الاختبار على تنبؤات باستخدام أفضل نموذج وسيحسب المقاييس نظرا لهذه التنبؤات.

يجب أن يكون هذا بين 0.0 و1.0 غير شامل. إذا test_data_size تم تحديد في نفس الوقت مثل validation_data_size، فسيتم تقسيم بيانات الاختبار من قبل تقسيم بيانات التحقق من training_data الصحة. على سبيل المثال، إذا كانت validation_data_size=0.1test_data_size=0.1 بيانات التدريب الأصلية تحتوي على 1000 صف، فسيكون لبيانات الاختبار 100 صف، وستحتوي بيانات التحقق من الصحة على 90 صفا وسيكون لبيانات التدريب 810 صفوف.

بالنسبة للمهام المستندة إلى الانحدار، يتم استخدام أخذ العينات العشوائية. بالنسبة لمهام التصنيف، يتم استخدام أخذ العينات الطبقية. لا يدعم التنبؤ حاليا تحديد مجموعة بيانات اختبار باستخدام تقسيم تدريب/اختبار.

إذا لم يتم تحديد هذه المعلمة أو المعلمة test_data ، فلن يتم تنفيذ أي تشغيل اختبار تلقائيا بعد اكتمال تدريب النموذج.

الإعدادات الافتراضية إلى بلا

forecasting_settings
ForecastingSettings

إعدادات مهمة التنبؤ

المرتجعات

كائن مهمة يمكن إرساله إلى حساب التعلم الآلي من Microsoft Azure للتنفيذ.

نوع الإرجاع

image_classification

إنشاء كائن لوظيفة AutoML Image Multi-class Classification.

image_classification(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationJob

المعلمات

training_data
Input

بيانات التدريب التي سيتم استخدامها داخل التجربة.

target_column_name
str

اسم عمود التسمية. هذه المعلمة قابلة للتطبيق على training_data المعلمات و validation_data .

primary_metric

المقياس الذي سيحسنه التعلم الآلي التلقائي لاختيار النموذج. يجمع التعلم الآلي التلقائي مقاييس أكثر مما يمكن تحسينه. لمزيد من المعلومات حول كيفية حساب المقاييس، راجع https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

القيم المقبولة: الدقة AUC_weighted norm_macro_recall average_precision_score_weighted والإعدادات الافتراضية precision_score_weighted إلى الدقة.

validation_data
Input

بيانات التحقق من الصحة التي سيتم استخدامها داخل التجربة.

validation_data_size
float

ما هو جزء البيانات المطلوب الاحتفاظ به للتحقق من الصحة عند عدم تحديد بيانات التحقق من صحة المستخدم. يجب أن يكون هذا بين 0.0 و1.0 غير شامل.

حدد validation_data لتوفير بيانات التحقق من الصحة، وإلا تم تعيينها validation_data_size لاستخراج بيانات التحقق من الصحة من بيانات التدريب المحددة.

الإعدادات الافتراضية إلى .2

kwargs
dict

قاموس معلمات تكوين إضافية.

المرتجعات

عنصر مهمة تصنيف الصور الذي يمكن إرساله إلى حساب التعلم الآلي من Microsoft Azure للتنفيذ.

نوع الإرجاع

image_classification_multilabel

إنشاء كائن لوظيفة AutoML Image Multi-label Classification.

image_classification_multilabel(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationMultilabelPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationMultilabelJob

المعلمات

training_data
Input

بيانات التدريب التي سيتم استخدامها داخل التجربة.

target_column_name
str

اسم عمود التسمية. هذه المعلمة قابلة للتطبيق على training_data المعلمات و validation_data .

primary_metric

المقياس الذي سيحسنه التعلم الآلي التلقائي لاختيار النموذج. يجمع التعلم الآلي التلقائي مقاييس أكثر مما يمكن تحسينه. لمزيد من المعلومات حول كيفية حساب المقاييس، راجع https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

القيم المقبولة: الدقة AUC_weighted norm_macro_recall average_precision_score_weighted precision_score_weighted وIou Defaults إلى Iou.

validation_data
Input

بيانات التحقق من الصحة التي سيتم استخدامها داخل التجربة.

validation_data_size
float

ما هو جزء البيانات المطلوب الاحتفاظ به للتحقق من الصحة عند عدم تحديد بيانات التحقق من صحة المستخدم. يجب أن يكون هذا بين 0.0 و1.0 غير شامل.

حدد validation_data لتوفير بيانات التحقق من الصحة، وإلا تم تعيينها validation_data_size لاستخراج بيانات التحقق من الصحة من بيانات التدريب المحددة.

الإعدادات الافتراضية إلى .2

kwargs
dict

قاموس معلمات تكوين إضافية.

المرتجعات

عنصر مهمة تصنيف متعدد التسميات للصورة يمكن إرساله إلى حساب التعلم الآلي من Microsoft Azure للتنفيذ.

نوع الإرجاع

image_instance_segmentation

إنشاء كائن لوظيفة تجزئة مثيل صورة AutoML.

image_instance_segmentation(*, training_data: Input, target_column_name: str, primary_metric: str | InstanceSegmentationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageInstanceSegmentationJob

المعلمات

training_data
Input

بيانات التدريب التي سيتم استخدامها داخل التجربة.

target_column_name
str

اسم عمود التسمية. هذه المعلمة قابلة للتطبيق على training_data المعلمات و validation_data .

primary_metric

المقياس الذي سيحسنه التعلم الآلي التلقائي لاختيار النموذج. يجمع التعلم الآلي التلقائي مقاييس أكثر مما يمكن تحسينه. لمزيد من المعلومات حول كيفية حساب المقاييس، راجع https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

القيم المقبولة: MeanAveragePrecision Defaults to MeanAveragePrecision.

validation_data
Input

بيانات التحقق من الصحة التي سيتم استخدامها داخل التجربة.

validation_data_size
float

ما هو جزء البيانات المطلوب الاحتفاظ به للتحقق من الصحة عند عدم تحديد بيانات التحقق من صحة المستخدم. يجب أن يكون هذا بين 0.0 و1.0 غير شامل.

حدد validation_data لتوفير بيانات التحقق من الصحة، وإلا تم تعيينها validation_data_size لاستخراج بيانات التحقق من الصحة من بيانات التدريب المحددة.

الإعدادات الافتراضية إلى .2

kwargs
dict

قاموس معلمات تكوين إضافية.

المرتجعات

مهمة تجزئة مثيل الصورة

نوع الإرجاع

image_object_detection

إنشاء كائن لوظيفة AutoML Image Object Detection.

image_object_detection(*, training_data: Input, target_column_name: str, primary_metric: str | ObjectDetectionPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageObjectDetectionJob

المعلمات

training_data
Input

بيانات التدريب التي سيتم استخدامها داخل التجربة.

target_column_name
str

اسم عمود التسمية. هذه المعلمة قابلة للتطبيق على training_data المعلمات و validation_data .

primary_metric

المقياس الذي سيحسنه التعلم الآلي التلقائي لاختيار النموذج. يجمع التعلم الآلي التلقائي مقاييس أكثر مما يمكن تحسينه. لمزيد من المعلومات حول كيفية حساب المقاييس، راجع https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

القيم المقبولة: MeanAveragePrecision Defaults to MeanAveragePrecision.

validation_data
Input

بيانات التحقق من الصحة التي سيتم استخدامها داخل التجربة.

validation_data_size
float

ما هو جزء البيانات المطلوب الاحتفاظ به للتحقق من الصحة عند عدم تحديد بيانات التحقق من صحة المستخدم. يجب أن يكون هذا بين 0.0 و1.0 غير شامل.

حدد validation_data لتوفير بيانات التحقق من الصحة، وإلا تم تعيينها validation_data_size لاستخراج بيانات التحقق من الصحة من بيانات التدريب المحددة.

الإعدادات الافتراضية إلى .2

kwargs
dict

قاموس معلمات تكوين إضافية.

المرتجعات

كائن مهمة الكشف عن كائن الصورة الذي يمكن إرساله إلى حساب التعلم الآلي من Microsoft Azure للتنفيذ.

نوع الإرجاع

regression

دالة لإنشاء مهمة انحدار.

يتم استخدام مهمة الانحدار لتدريب نموذج للتنبؤ بالقيم المستمرة لمتغير هدف من مجموعة بيانات. يتم تدريب نماذج مختلفة باستخدام بيانات التدريب. يتم تحديد النموذج الذي يحتوي على أفضل أداء على بيانات التحقق من الصحة استنادا إلى المقياس الأساسي كنموذج نهائي.

regression(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> RegressionJob

المعلمات

training_data
Input

بيانات التدريب التي سيتم استخدامها داخل التجربة. يجب أن يحتوي على كل من ميزات التدريب وعمود التسمية (اختياريا عمود أوزان العينة).

target_column_name
str

اسم عمود التسمية. تنطبق هذه المعلمة على training_datavalidation_data المعلمات و test_data

primary_metric

المقياس الذي سيحسنه التعلم الآلي التلقائي لاختيار النموذج. يجمع التعلم الآلي التلقائي مقاييس أكثر مما يمكن تحسينه. لمزيد من المعلومات حول كيفية حساب المقاييس، راجع https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

القيم المقبولة: spearman_correlation، r2_score، normalized_mean_absolute_error، normalized_root_mean_squared_error. الإعدادات الافتراضية normalized_root_mean_squared_error

enable_model_explainability
bool

ما إذا كان سيتم تمكين شرح أفضل نموذج AutoML في نهاية جميع تكرارات تدريب AutoML. الإعداد الافتراضي هو لا شيء. لمزيد من المعلومات، راجع قابلية التفسير: تفسيرات النموذج في التعلم الآلي التلقائي.

weight_column_name
str

اسم عمود وزن العينة. يدعم التعلم الآلي التلقائي عمودا مرجحا كإدخل، ما يتسبب في ترجيح الصفوف في البيانات لأعلى أو لأسفل. إذا كانت بيانات الإدخال من pandas. DataFrame الذي لا يحتوي على أسماء أعمدة، يمكن استخدام مؤشرات الأعمدة بدلا من ذلك، مع التعبير عنها كأعداد صحيحة.

هذه المعلمة قابلة للتطبيق على training_data المعلمات و validation_data

validation_data
Input

بيانات التحقق من الصحة التي سيتم استخدامها داخل التجربة. يجب أن يحتوي على كل من ميزات التدريب وعمود التسمية (اختياريا عمود أوزان العينة).

الإعدادات الافتراضية إلى بلا

validation_data_size
float

ما هو جزء البيانات المطلوب الاحتفاظ به للتحقق من الصحة عند عدم تحديد بيانات التحقق من صحة المستخدم. يجب أن يكون هذا بين 0.0 و1.0 غير شامل.

حدد validation_data لتوفير بيانات التحقق من الصحة، أو تعيين n_cross_validations أو validation_data_size لاستخراج بيانات التحقق من الصحة من بيانات التدريب المحددة. بالنسبة إلى طية التحقق المقطعي المخصصة، استخدم cv_split_column_names.

لمزيد من المعلومات، راجع تكوين تقسيمات البيانات والتحقق المتبادل في التعلم الآلي التلقائي.

الإعدادات الافتراضية إلى بلا

n_cross_validations
Union[str, int]

كم عدد عمليات التحقق المتقاطعة التي يجب إجراؤها عند عدم تحديد بيانات التحقق من صحة المستخدم.

حدد validation_data لتوفير بيانات التحقق من الصحة، أو تعيين n_cross_validations أو validation_data_size لاستخراج بيانات التحقق من الصحة من بيانات التدريب المحددة. بالنسبة إلى طية التحقق المقطعي المخصصة، استخدم cv_split_column_names.

لمزيد من المعلومات، راجع تكوين تقسيمات البيانات والتحقق المتبادل في التعلم الآلي التلقائي.

الإعدادات الافتراضية إلى بلا

cv_split_column_names
List[str]

قائمة بأسماء الأعمدة التي تحتوي على تقسيم مخصص للتحقق من الصحة المتقاطع. يمثل كل عمود من أعمدة تقسيم CV تقسيم سيرة ذاتية واحد حيث يتم وضع علامة على كل صف إما 1 للتدريب أو 0 للتحقق من الصحة.

الإعدادات الافتراضية إلى بلا

test_data
Input

ميزة اختبار النموذج باستخدام مجموعات بيانات الاختبار أو تقسيم بيانات الاختبار هي ميزة في حالة المعاينة وقد تتغير في أي وقت. بيانات الاختبار التي سيتم استخدامها لتشغيل اختبار سيتم بدء تشغيله تلقائيا بعد اكتمال تدريب النموذج. سيحصل تشغيل الاختبار على تنبؤات باستخدام أفضل نموذج وسيحسب المقاييس نظرا لهذه التنبؤات.

إذا لم يتم تحديد هذه المعلمة أو المعلمة test_data_size ، فلن يتم تنفيذ أي تشغيل اختبار تلقائيا بعد اكتمال تدريب النموذج. يجب أن تحتوي بيانات الاختبار على كل من الميزات وعمود التسمية. إذا test_data تم تحديد ثم target_column_name يجب تحديد المعلمة.

الإعدادات الافتراضية إلى بلا

test_data_size
float

ميزة اختبار النموذج باستخدام مجموعات بيانات الاختبار أو تقسيم بيانات الاختبار هي ميزة في حالة المعاينة وقد تتغير في أي وقت. ما هو جزء من بيانات التدريب التي يجب الاحتفاظ بها لبيانات الاختبار لتشغيل اختبار سيتم تشغيله تلقائيا بعد اكتمال تدريب النموذج. سيحصل تشغيل الاختبار على تنبؤات باستخدام أفضل نموذج وسيحسب المقاييس نظرا لهذه التنبؤات.

يجب أن يكون هذا بين 0.0 و1.0 غير شامل. إذا test_data_size تم تحديد في نفس الوقت مثل validation_data_size، فسيتم تقسيم بيانات الاختبار من قبل تقسيم بيانات التحقق من training_data الصحة. على سبيل المثال، إذا كانت validation_data_size=0.1test_data_size=0.1 بيانات التدريب الأصلية تحتوي على 1000 صف، فسيكون لبيانات الاختبار 100 صف، وستحتوي بيانات التحقق من الصحة على 90 صفا وسيكون لبيانات التدريب 810 صفوف.

بالنسبة للمهام المستندة إلى الانحدار، يتم استخدام أخذ العينات العشوائية. بالنسبة لمهام التصنيف، يتم استخدام أخذ العينات الطبقية. لا يدعم التنبؤ حاليا تحديد مجموعة بيانات اختبار باستخدام تقسيم تدريب/اختبار.

إذا لم يتم تحديد هذه المعلمة أو المعلمة test_data ، فلن يتم تنفيذ أي تشغيل اختبار تلقائيا بعد اكتمال تدريب النموذج.

الإعدادات الافتراضية إلى بلا

المرتجعات

كائن مهمة يمكن إرساله إلى حساب التعلم الآلي من Microsoft Azure للتنفيذ.

نوع الإرجاع

text_classification

دالة لإنشاء TextClassificationJob.

يتم استخدام مهمة تصنيف النص لتدريب نموذج يمكنه التنبؤ بفئة/فئة البيانات النصية. يجب أن تتضمن بيانات تدريب الإدخال عمودا مستهدفا يصنف النص إلى فئة واحدة بالضبط.

text_classification(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationJob

المعلمات

training_data
Input

بيانات التدريب التي سيتم استخدامها داخل التجربة. يجب أن يحتوي على كل من ميزات التدريب والعمود الهدف.

target_column_name
str

اسم العمود الهدف.

validation_data
Input

بيانات التحقق من الصحة التي سيتم استخدامها داخل التجربة. يجب أن يحتوي على كل من ميزات التدريب والعمود الهدف.

primary_metric
Union[str, ClassificationPrimaryMetrics]

المقياس الأساسي للمهمة. القيم المقبولة: الدقة، AUC_weighted، precision_score_weighted

log_verbosity
str

مستوى الإسهاب في السجل.

kwargs
dict

قاموس معلمات تكوين إضافية.

المرتجعات

عنصر TextClassificationJob.

نوع الإرجاع

text_classification_multilabel

دالة لإنشاء TextClassificationMultilabelJob.

يتم استخدام مهمة متعددة التسميات لتصنيف النص لتدريب نموذج يمكنه التنبؤ بفئات/فئات البيانات النصية. يجب أن تتضمن بيانات تدريب الإدخال عمودا مستهدفا يصنف النص إلى فئة (فئات). لمزيد من المعلومات حول تنسيق البيانات متعددة التسميات، راجع: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#multi-label

text_classification_multilabel(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationMultilabelJob

المعلمات

training_data
Input

بيانات التدريب التي سيتم استخدامها داخل التجربة. يجب أن يحتوي على كل من ميزات التدريب والعمود الهدف.

target_column_name
str

اسم العمود الهدف.

validation_data
Input

بيانات التحقق من الصحة التي سيتم استخدامها داخل التجربة. يجب أن يحتوي على كل من ميزات التدريب والعمود الهدف.

primary_metric
str

المقياس الأساسي للمهمة. القيم المقبولة: الدقة

log_verbosity
str

مستوى الإسهاب في السجل.

kwargs
dict

قاموس معلمات تكوين إضافية.

المرتجعات

عنصر TextClassificationMultilabelJob.

نوع الإرجاع

text_ner

دالة لإنشاء TextNerJob.

يتم استخدام مهمة التعرف على الكيان المسماة لتدريب نموذج يمكنه التنبؤ بالكيانات المسماة في النص. يجب أن تكون بيانات تدريب الإدخال ملفا نصيا بتنسيق CoNLL. لمزيد من المعلومات حول تنسيق بيانات NER النصية، راجع: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#named-entity-recognition-ner

text_ner(*, training_data: Input, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextNerJob

المعلمات

training_data
Input

بيانات التدريب التي سيتم استخدامها داخل التجربة. يجب أن يحتوي على كل من ميزات التدريب والعمود الهدف.

validation_data
Input

بيانات التحقق من الصحة التي سيتم استخدامها داخل التجربة. يجب أن يحتوي على كل من ميزات التدريب والعمود الهدف.

primary_metric
str

المقياس الأساسي للمهمة. القيم المقبولة: الدقة

log_verbosity
str

مستوى الإسهاب في السجل.

kwargs
dict

قاموس معلمات تكوين إضافية.

المرتجعات

كائن TextNerJob.

نوع الإرجاع