automl الحزمة
يحتوي على فئات التعلم الآلي المؤتمتة ل Azure Machine Learning SDKv2.
تتضمن المجالات الرئيسية إدارة مهام AutoML.
الفصول
ClassificationJob |
تكوين مهمة تصنيف AutoML. تهيئة مهمة تصنيف AutoML جديدة. |
ColumnTransformer |
إعدادات محول العمود. |
ForecastingJob |
تكوين مهمة التنبؤ ب AutoML. تهيئة مهمة تنبؤ AutoML جديدة. |
ForecastingSettings |
إعدادات التنبؤ لوظيفة AutoML. |
ImageClassificationJob |
تكوين مهمة تصنيف الصور متعددة الفئات ل AutoML. تهيئة مهمة AutoML جديدة متعددة الفئات لتصنيف الصور. |
ImageClassificationMultilabelJob |
تكوين مهمة تصنيف الصور متعددة التسميات ل AutoML. تهيئة مهمة AutoML جديدة متعددة التسميات لتصنيف الصور. |
ImageClassificationSearchSpace |
ابحث عن مساحة لتصنيف صور AutoML وتصنيف الصور متعدد المهام. |
ImageInstanceSegmentationJob |
تكوين مهمة تجزئة مثيل صورة AutoML. تهيئة مهمة تجزئة مثيل صورة AutoML جديدة. |
ImageLimitSettings |
تحديد إعدادات AutoML Image Verticals. ImageLimitSettings هي فئة تحتوي على المعلمات التالية: max_concurrent_trials max_trials timeout_minutes. هذه طريقة تكوين اختيارية لتكوين معلمات الحدود مثل المهلات وما إلى ذلك. ملاحظة يتم تحديد عدد عمليات التشغيل المتزامنة على الموارد المتاحة في هدف الحساب المحدد. تأكد من أن الهدف الحسابي لديه الموارد المتاحة للتزامن المطلوب. تلميح من الممارسات الجيدة مطابقة عدد max_concurrent_trials مع عدد العقد في نظام المجموعة. على سبيل المثال، إذا كان لديك نظام مجموعة مع 4 عقد، فقم بتعيين max_concurrent_trials إلى 4. استخدام المثال تكوين ImageLimitSettings
تهيئة كائن ImageLimitSettings. الدالة الإنشائية ل ImageLimitSettings ل AutoML Image Verticals. |
ImageModelSettingsClassification |
إعدادات النموذج لمهام تصنيف صور AutoML. |
ImageModelSettingsObjectDetection |
إعدادات النموذج لمهمة الكشف عن كائن صورة AutoML. |
ImageObjectDetectionJob |
تكوين مهمة AutoML Image Object Detection. تهيئة مهمة AutoML Image Object Detection جديدة. |
ImageObjectDetectionSearchSpace |
مساحة البحث عن مهام الكشف عن كائن صورة AutoML وتجزئة مثيل الصورة. |
ImageSweepSettings |
إعدادات المسح لجميع أعموديات صور AutoML. |
NlpFeaturizationSettings |
إعدادات التمييز لجميع أعموديات NLP الخاصة ب AutoML. |
NlpFixedParameters |
كائن لإيواء معلمات ثابتة لوظائف NLP. |
NlpLimitSettings |
تحديد الإعدادات لكافة القطاعات العمودية ل AutoML NLP. |
NlpSearchSpace |
ابحث عن مساحة لمهام AutoML NLP. |
NlpSweepSettings |
إعدادات المسح لجميع مهام AutoML NLP. |
RegressionJob |
تكوين مهمة انحدار AutoML. تهيئة مهمة انحدار AutoML جديدة. |
SearchSpace |
فئة SearchSpace لعموديات AutoML. |
StackEnsembleSettings |
إعداد مسبق لتخصيص تشغيل StackEnsemble. |
TabularFeaturizationSettings |
إعدادات التمييز لوظيفة AutoML. |
TabularLimitSettings |
تحديد الإعدادات لعموديات جدول AutoML. |
TextClassificationJob |
تكوين مهمة تصنيف نص AutoML. تهيئة مهمة تصنيف نص AutoML جديدة. |
TextClassificationMultilabelJob |
تكوين مهمة Multilabel لتصنيف نص AutoML. تهيئة مهمة AutoML Text Classification Multilabel جديدة. |
TextNerJob |
تكوين مهمة NER لنص AutoML. تهيئة مهمة AutoML Text NER جديدة. |
TrainingSettings |
فئة TrainingSettings للتعلم الآلي من Microsoft Azure. فئة TrainingSettings للتعلم الآلي من Microsoft Azure. |
التعدادات
BlockedTransformers |
تعداد لجميع نماذج التصنيف التي يدعمها AutoML. |
ClassificationModels |
تعداد لجميع نماذج التصنيف التي يدعمها AutoML. |
ClassificationMultilabelPrimaryMetrics |
المقاييس الأساسية لتصنيف المهام متعددة التسميات. |
ClassificationPrimaryMetrics |
المقاييس الأساسية لمهام التصنيف. |
FeaturizationMode |
وضع التمييز - يحدد وضع تمييز البيانات. |
ForecastHorizonMode |
تعداد لتحديد وضع تحديد أفق التنبؤ. |
ForecastingModels |
تعداد لجميع نماذج التنبؤ التي يدعمها AutoML. |
ForecastingPrimaryMetrics |
المقاييس الأساسية لمهمة التنبؤ. |
InstanceSegmentationPrimaryMetrics |
المقاييس الأساسية لمهام InstanceSegmentation. |
LearningRateScheduler |
قائمة تعداد جدولة معدل التعلم. |
LogTrainingMetrics |
يحتوي على فئات التعلم الآلي المؤتمتة ل Azure Machine Learning SDKv2. تتضمن المجالات الرئيسية إدارة مهام AutoML. |
LogValidationLoss |
يحتوي على فئات التعلم الآلي المؤتمتة ل Azure Machine Learning SDKv2. تتضمن المجالات الرئيسية إدارة مهام AutoML. |
NCrossValidationsMode |
تحديد كيفية تحديد قيمة عمليات التحقق من الصحة N-Cross. |
ObjectDetectionPrimaryMetrics |
المقاييس الأساسية لمهمة Image ObjectDetection. |
RegressionModels |
تعداد لجميع نماذج الانحدار التي يدعمها AutoML. |
RegressionPrimaryMetrics |
المقاييس الأساسية لمهمة الانحدار. |
SamplingAlgorithmType |
يحتوي على فئات التعلم الآلي المؤتمتة ل Azure Machine Learning SDKv2. تتضمن المجالات الرئيسية إدارة مهام AutoML. |
ShortSeriesHandlingConfiguration |
المعلمة التي تحدد كيفية معالجة AutoML للسلاسل الزمنية القصيرة. |
StochasticOptimizer |
محسن Stochastic لنماذج الصور. |
TargetAggregationFunction |
الدالة التجميعية الهدف. |
TargetLagsMode |
أوضاع تحديد التأخر المستهدفة. |
TargetRollingWindowSizeMode |
وضع حجم النوافذ المتداول الهدف. |
UseStl |
تكوين تحليل STL لعمود هدف السلسلة الزمنية. |
ValidationMetricType |
أسلوب حساب القياس لاستخدامه لمقاييس التحقق من الصحة في مهام الصورة. |
الوظائف
classification
دالة لإنشاء ClassificationJob.
يتم استخدام مهمة التصنيف لتدريب نموذج يتنبأ بشكل أفضل بفئة عينة البيانات. يتم تدريب نماذج مختلفة باستخدام بيانات التدريب. يتم تحديد النموذج الذي يحتوي على أفضل أداء على بيانات التحقق من الصحة استنادا إلى المقياس الأساسي كنموذج نهائي.
classification(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> ClassificationJob
المعلمات
- training_data
- Input
بيانات التدريب التي سيتم استخدامها داخل التجربة. يجب أن يحتوي على كل من ميزات التدريب وعمود التسمية (اختياريا عمود أوزان العينة).
- target_column_name
- str
اسم عمود التسمية.
تنطبق هذه المعلمة على training_data
validation_data
المعلمات و test_data
- primary_metric
المقياس الذي سيحسنه التعلم الآلي التلقائي لاختيار النموذج. يجمع التعلم الآلي التلقائي مقاييس أكثر مما يمكن تحسينه. لمزيد من المعلومات حول كيفية حساب المقاييس، راجع https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
القيم المقبولة: الدقة AUC_weighted norm_macro_recall average_precision_score_weighted والإعدادات الافتراضية precision_score_weighted إلى الدقة
- enable_model_explainability
- bool
ما إذا كان سيتم تمكين شرح أفضل نموذج AutoML في نهاية جميع تكرارات تدريب AutoML. الإعداد الافتراضي هو لا شيء. لمزيد من المعلومات، راجع قابلية التفسير: تفسيرات النموذج في التعلم الآلي التلقائي.
- weight_column_name
- str
اسم عمود وزن العينة. يدعم التعلم الآلي التلقائي عمودا مرجحا كإدخل، ما يتسبب في ترجيح الصفوف في البيانات لأعلى أو لأسفل. إذا كانت بيانات الإدخال من pandas. DataFrame الذي لا يحتوي على أسماء أعمدة، يمكن استخدام مؤشرات الأعمدة بدلا من ذلك، مع التعبير عنها كأعداد صحيحة.
هذه المعلمة قابلة للتطبيق على training_data
المعلمات و validation_data
- validation_data
- Input
بيانات التحقق من الصحة التي سيتم استخدامها داخل التجربة. يجب أن يحتوي على كل من ميزات التدريب وعمود التسمية (اختياريا عمود أوزان العينة).
الإعدادات الافتراضية إلى بلا
- validation_data_size
- float
ما هو جزء البيانات المطلوب الاحتفاظ به للتحقق من الصحة عند عدم تحديد بيانات التحقق من صحة المستخدم. يجب أن يكون هذا بين 0.0 و1.0 غير شامل.
حدد validation_data
لتوفير بيانات التحقق من الصحة، أو تعيين n_cross_validations
أو validation_data_size
لاستخراج بيانات التحقق من الصحة من بيانات التدريب المحددة.
بالنسبة إلى طية التحقق المقطعي المخصصة، استخدم cv_split_column_names
.
لمزيد من المعلومات، راجع تكوين تقسيمات البيانات والتحقق المتبادل في التعلم الآلي التلقائي.
الإعدادات الافتراضية إلى بلا
كم عدد عمليات التحقق المتقاطعة التي يجب إجراؤها عند عدم تحديد بيانات التحقق من صحة المستخدم.
حدد validation_data
لتوفير بيانات التحقق من الصحة، أو تعيين n_cross_validations
أو validation_data_size
لاستخراج بيانات التحقق من الصحة من بيانات التدريب المحددة.
بالنسبة إلى طية التحقق المقطعي المخصصة، استخدم cv_split_column_names
.
لمزيد من المعلومات، راجع تكوين تقسيمات البيانات والتحقق المتبادل في التعلم الآلي التلقائي.
الإعدادات الافتراضية إلى بلا
قائمة بأسماء الأعمدة التي تحتوي على تقسيم مخصص للتحقق من الصحة المتقاطع. يمثل كل عمود من أعمدة تقسيم CV تقسيم سيرة ذاتية واحد حيث يتم وضع علامة على كل صف إما 1 للتدريب أو 0 للتحقق من الصحة.
الإعدادات الافتراضية إلى بلا
- test_data
- Input
ميزة اختبار النموذج باستخدام مجموعات بيانات الاختبار أو تقسيم بيانات الاختبار هي ميزة في حالة المعاينة وقد تتغير في أي وقت. بيانات الاختبار التي سيتم استخدامها لتشغيل اختبار سيتم بدء تشغيله تلقائيا بعد اكتمال تدريب النموذج. سيحصل تشغيل الاختبار على تنبؤات باستخدام أفضل نموذج وسيحسب المقاييس نظرا لهذه التنبؤات.
إذا لم يتم تحديد هذه المعلمة أو المعلمة test_data_size
، فلن يتم تنفيذ أي تشغيل اختبار تلقائيا بعد اكتمال تدريب النموذج.
يجب أن تحتوي بيانات الاختبار على كل من الميزات وعمود التسمية.
إذا test_data
تم تحديد ثم target_column_name
يجب تحديد المعلمة.
الإعدادات الافتراضية إلى بلا
- test_data_size
- float
ميزة اختبار النموذج باستخدام مجموعات بيانات الاختبار أو تقسيم بيانات الاختبار هي ميزة في حالة المعاينة وقد تتغير في أي وقت. ما هو جزء من بيانات التدريب التي يجب الاحتفاظ بها لبيانات الاختبار لتشغيل اختبار سيتم تشغيله تلقائيا بعد اكتمال تدريب النموذج. سيحصل تشغيل الاختبار على تنبؤات باستخدام أفضل نموذج وسيحسب المقاييس نظرا لهذه التنبؤات.
يجب أن يكون هذا بين 0.0 و1.0 غير شامل.
إذا test_data_size
تم تحديد في نفس الوقت مثل validation_data_size
، فسيتم تقسيم بيانات الاختبار من قبل تقسيم بيانات التحقق من training_data
الصحة.
على سبيل المثال، إذا كانت validation_data_size=0.1
test_data_size=0.1
بيانات التدريب الأصلية تحتوي على 1000 صف، فسيكون لبيانات الاختبار 100 صف، وستحتوي بيانات التحقق من الصحة على 90 صفا وسيكون لبيانات التدريب 810 صفوف.
بالنسبة للمهام المستندة إلى الانحدار، يتم استخدام أخذ العينات العشوائية. بالنسبة لمهام التصنيف، يتم استخدام أخذ العينات الطبقية. لا يدعم التنبؤ حاليا تحديد مجموعة بيانات اختبار باستخدام تقسيم تدريب/اختبار.
إذا لم يتم تحديد هذه المعلمة أو المعلمة test_data
، فلن يتم تنفيذ أي تشغيل اختبار تلقائيا بعد اكتمال تدريب النموذج.
الإعدادات الافتراضية إلى بلا
المرتجعات
كائن مهمة يمكن إرساله إلى حساب التعلم الآلي من Microsoft Azure للتنفيذ.
نوع الإرجاع
forecasting
دالة لإنشاء مهمة تنبؤ.
يتم استخدام مهمة التنبؤ للتنبؤ بالقيم المستهدفة لفترة زمنية مستقبلية استنادا إلى البيانات التاريخية. يتم تدريب نماذج مختلفة باستخدام بيانات التدريب. يتم تحديد النموذج الذي يحتوي على أفضل أداء على بيانات التحقق من الصحة استنادا إلى المقياس الأساسي كنموذج نهائي.
forecasting(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, forecasting_settings: ForecastingSettings | None = None, **kwargs) -> ForecastingJob
المعلمات
- training_data
- Input
بيانات التدريب التي سيتم استخدامها داخل التجربة. يجب أن يحتوي على كل من ميزات التدريب وعمود التسمية (اختياريا عمود أوزان العينة).
- target_column_name
- str
اسم عمود التسمية.
تنطبق هذه المعلمة على training_data
validation_data
المعلمات و test_data
- primary_metric
المقياس الذي سيحسنه التعلم الآلي التلقائي لاختيار النموذج. يجمع التعلم الآلي التلقائي مقاييس أكثر مما يمكن تحسينه. لمزيد من المعلومات حول كيفية حساب المقاييس، راجع https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
القيم المقبولة: r2_score أو normalized_mean_absolute_error أو الإعدادات الافتراضية normalized_root_mean_squared_error normalized_root_mean_squared_error
- enable_model_explainability
- bool
ما إذا كان سيتم تمكين شرح أفضل نموذج AutoML في نهاية جميع تكرارات تدريب AutoML. الإعداد الافتراضي هو لا شيء. لمزيد من المعلومات، راجع قابلية التفسير: تفسيرات النموذج في التعلم الآلي التلقائي.
- weight_column_name
- str
اسم عمود وزن العينة. يدعم التعلم الآلي التلقائي عمودا مرجحا كإدخل، ما يتسبب في ترجيح الصفوف في البيانات لأعلى أو لأسفل. إذا كانت بيانات الإدخال من pandas. DataFrame الذي لا يحتوي على أسماء أعمدة، يمكن استخدام مؤشرات الأعمدة بدلا من ذلك، مع التعبير عنها كأعداد صحيحة.
هذه المعلمة قابلة للتطبيق على training_data
المعلمات و validation_data
- validation_data
- Input
بيانات التحقق من الصحة التي سيتم استخدامها داخل التجربة. يجب أن يحتوي على كل من ميزات التدريب وعمود التسمية (اختياريا عمود أوزان العينة).
الإعدادات الافتراضية إلى بلا
- validation_data_size
- float
ما هو جزء البيانات المطلوب الاحتفاظ به للتحقق من الصحة عند عدم تحديد بيانات التحقق من صحة المستخدم. يجب أن يكون هذا بين 0.0 و1.0 غير شامل.
حدد validation_data
لتوفير بيانات التحقق من الصحة، أو تعيين n_cross_validations
أو validation_data_size
لاستخراج بيانات التحقق من الصحة من بيانات التدريب المحددة.
بالنسبة إلى طية التحقق المقطعي المخصصة، استخدم cv_split_column_names
.
لمزيد من المعلومات، راجع تكوين تقسيمات البيانات والتحقق المتبادل في التعلم الآلي التلقائي.
الإعدادات الافتراضية إلى بلا
كم عدد عمليات التحقق المتقاطعة التي يجب إجراؤها عند عدم تحديد بيانات التحقق من صحة المستخدم.
حدد validation_data
لتوفير بيانات التحقق من الصحة، أو تعيين n_cross_validations
أو validation_data_size
لاستخراج بيانات التحقق من الصحة من بيانات التدريب المحددة.
بالنسبة إلى طية التحقق المقطعي المخصصة، استخدم cv_split_column_names
.
لمزيد من المعلومات، راجع تكوين تقسيمات البيانات والتحقق المتبادل في التعلم الآلي التلقائي.
الإعدادات الافتراضية إلى بلا
قائمة بأسماء الأعمدة التي تحتوي على تقسيم مخصص للتحقق من الصحة المتقاطع. يمثل كل عمود من أعمدة تقسيم CV تقسيم سيرة ذاتية واحد حيث يتم وضع علامة على كل صف إما 1 للتدريب أو 0 للتحقق من الصحة.
الإعدادات الافتراضية إلى بلا
- test_data
- Input
ميزة اختبار النموذج باستخدام مجموعات بيانات الاختبار أو تقسيم بيانات الاختبار هي ميزة في حالة المعاينة وقد تتغير في أي وقت. بيانات الاختبار التي سيتم استخدامها لتشغيل اختبار سيتم بدء تشغيله تلقائيا بعد اكتمال تدريب النموذج. سيحصل تشغيل الاختبار على تنبؤات باستخدام أفضل نموذج وسيحسب المقاييس نظرا لهذه التنبؤات.
إذا لم يتم تحديد هذه المعلمة أو المعلمة test_data_size
، فلن يتم تنفيذ أي تشغيل اختبار تلقائيا بعد اكتمال تدريب النموذج.
يجب أن تحتوي بيانات الاختبار على كل من الميزات وعمود التسمية.
إذا test_data
تم تحديد ثم target_column_name
يجب تحديد المعلمة.
الإعدادات الافتراضية إلى بلا
- test_data_size
- float
ميزة اختبار النموذج باستخدام مجموعات بيانات الاختبار أو تقسيم بيانات الاختبار هي ميزة في حالة المعاينة وقد تتغير في أي وقت. ما هو جزء من بيانات التدريب التي يجب الاحتفاظ بها لبيانات الاختبار لتشغيل اختبار سيتم تشغيله تلقائيا بعد اكتمال تدريب النموذج. سيحصل تشغيل الاختبار على تنبؤات باستخدام أفضل نموذج وسيحسب المقاييس نظرا لهذه التنبؤات.
يجب أن يكون هذا بين 0.0 و1.0 غير شامل.
إذا test_data_size
تم تحديد في نفس الوقت مثل validation_data_size
، فسيتم تقسيم بيانات الاختبار من قبل تقسيم بيانات التحقق من training_data
الصحة.
على سبيل المثال، إذا كانت validation_data_size=0.1
test_data_size=0.1
بيانات التدريب الأصلية تحتوي على 1000 صف، فسيكون لبيانات الاختبار 100 صف، وستحتوي بيانات التحقق من الصحة على 90 صفا وسيكون لبيانات التدريب 810 صفوف.
بالنسبة للمهام المستندة إلى الانحدار، يتم استخدام أخذ العينات العشوائية. بالنسبة لمهام التصنيف، يتم استخدام أخذ العينات الطبقية. لا يدعم التنبؤ حاليا تحديد مجموعة بيانات اختبار باستخدام تقسيم تدريب/اختبار.
إذا لم يتم تحديد هذه المعلمة أو المعلمة test_data
، فلن يتم تنفيذ أي تشغيل اختبار تلقائيا بعد اكتمال تدريب النموذج.
الإعدادات الافتراضية إلى بلا
- forecasting_settings
- ForecastingSettings
إعدادات مهمة التنبؤ
المرتجعات
كائن مهمة يمكن إرساله إلى حساب التعلم الآلي من Microsoft Azure للتنفيذ.
نوع الإرجاع
image_classification
إنشاء كائن لوظيفة AutoML Image Multi-class Classification.
image_classification(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationJob
المعلمات
- training_data
- Input
بيانات التدريب التي سيتم استخدامها داخل التجربة.
- target_column_name
- str
اسم عمود التسمية.
هذه المعلمة قابلة للتطبيق على training_data
المعلمات و validation_data
.
- primary_metric
المقياس الذي سيحسنه التعلم الآلي التلقائي لاختيار النموذج. يجمع التعلم الآلي التلقائي مقاييس أكثر مما يمكن تحسينه. لمزيد من المعلومات حول كيفية حساب المقاييس، راجع https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
القيم المقبولة: الدقة AUC_weighted norm_macro_recall average_precision_score_weighted والإعدادات الافتراضية precision_score_weighted إلى الدقة.
- validation_data
- Input
بيانات التحقق من الصحة التي سيتم استخدامها داخل التجربة.
- validation_data_size
- float
ما هو جزء البيانات المطلوب الاحتفاظ به للتحقق من الصحة عند عدم تحديد بيانات التحقق من صحة المستخدم. يجب أن يكون هذا بين 0.0 و1.0 غير شامل.
حدد validation_data
لتوفير بيانات التحقق من الصحة، وإلا تم تعيينها validation_data_size
لاستخراج بيانات التحقق من الصحة من بيانات التدريب المحددة.
الإعدادات الافتراضية إلى .2
- kwargs
- dict
قاموس معلمات تكوين إضافية.
المرتجعات
عنصر مهمة تصنيف الصور الذي يمكن إرساله إلى حساب التعلم الآلي من Microsoft Azure للتنفيذ.
نوع الإرجاع
image_classification_multilabel
إنشاء كائن لوظيفة AutoML Image Multi-label Classification.
image_classification_multilabel(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationMultilabelPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationMultilabelJob
المعلمات
- training_data
- Input
بيانات التدريب التي سيتم استخدامها داخل التجربة.
- target_column_name
- str
اسم عمود التسمية.
هذه المعلمة قابلة للتطبيق على training_data
المعلمات و validation_data
.
- primary_metric
المقياس الذي سيحسنه التعلم الآلي التلقائي لاختيار النموذج. يجمع التعلم الآلي التلقائي مقاييس أكثر مما يمكن تحسينه. لمزيد من المعلومات حول كيفية حساب المقاييس، راجع https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
القيم المقبولة: الدقة AUC_weighted norm_macro_recall average_precision_score_weighted precision_score_weighted وIou Defaults إلى Iou.
- validation_data
- Input
بيانات التحقق من الصحة التي سيتم استخدامها داخل التجربة.
- validation_data_size
- float
ما هو جزء البيانات المطلوب الاحتفاظ به للتحقق من الصحة عند عدم تحديد بيانات التحقق من صحة المستخدم. يجب أن يكون هذا بين 0.0 و1.0 غير شامل.
حدد validation_data
لتوفير بيانات التحقق من الصحة، وإلا تم تعيينها validation_data_size
لاستخراج بيانات التحقق من الصحة من بيانات التدريب المحددة.
الإعدادات الافتراضية إلى .2
- kwargs
- dict
قاموس معلمات تكوين إضافية.
المرتجعات
عنصر مهمة تصنيف متعدد التسميات للصورة يمكن إرساله إلى حساب التعلم الآلي من Microsoft Azure للتنفيذ.
نوع الإرجاع
image_instance_segmentation
إنشاء كائن لوظيفة تجزئة مثيل صورة AutoML.
image_instance_segmentation(*, training_data: Input, target_column_name: str, primary_metric: str | InstanceSegmentationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageInstanceSegmentationJob
المعلمات
- training_data
- Input
بيانات التدريب التي سيتم استخدامها داخل التجربة.
- target_column_name
- str
اسم عمود التسمية.
هذه المعلمة قابلة للتطبيق على training_data
المعلمات و validation_data
.
- primary_metric
المقياس الذي سيحسنه التعلم الآلي التلقائي لاختيار النموذج. يجمع التعلم الآلي التلقائي مقاييس أكثر مما يمكن تحسينه. لمزيد من المعلومات حول كيفية حساب المقاييس، راجع https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
القيم المقبولة: MeanAveragePrecision Defaults to MeanAveragePrecision.
- validation_data
- Input
بيانات التحقق من الصحة التي سيتم استخدامها داخل التجربة.
- validation_data_size
- float
ما هو جزء البيانات المطلوب الاحتفاظ به للتحقق من الصحة عند عدم تحديد بيانات التحقق من صحة المستخدم. يجب أن يكون هذا بين 0.0 و1.0 غير شامل.
حدد validation_data
لتوفير بيانات التحقق من الصحة، وإلا تم تعيينها validation_data_size
لاستخراج بيانات التحقق من الصحة من بيانات التدريب المحددة.
الإعدادات الافتراضية إلى .2
- kwargs
- dict
قاموس معلمات تكوين إضافية.
المرتجعات
مهمة تجزئة مثيل الصورة
نوع الإرجاع
image_object_detection
إنشاء كائن لوظيفة AutoML Image Object Detection.
image_object_detection(*, training_data: Input, target_column_name: str, primary_metric: str | ObjectDetectionPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageObjectDetectionJob
المعلمات
- training_data
- Input
بيانات التدريب التي سيتم استخدامها داخل التجربة.
- target_column_name
- str
اسم عمود التسمية.
هذه المعلمة قابلة للتطبيق على training_data
المعلمات و validation_data
.
- primary_metric
المقياس الذي سيحسنه التعلم الآلي التلقائي لاختيار النموذج. يجمع التعلم الآلي التلقائي مقاييس أكثر مما يمكن تحسينه. لمزيد من المعلومات حول كيفية حساب المقاييس، راجع https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
القيم المقبولة: MeanAveragePrecision Defaults to MeanAveragePrecision.
- validation_data
- Input
بيانات التحقق من الصحة التي سيتم استخدامها داخل التجربة.
- validation_data_size
- float
ما هو جزء البيانات المطلوب الاحتفاظ به للتحقق من الصحة عند عدم تحديد بيانات التحقق من صحة المستخدم. يجب أن يكون هذا بين 0.0 و1.0 غير شامل.
حدد validation_data
لتوفير بيانات التحقق من الصحة، وإلا تم تعيينها validation_data_size
لاستخراج بيانات التحقق من الصحة من بيانات التدريب المحددة.
الإعدادات الافتراضية إلى .2
- kwargs
- dict
قاموس معلمات تكوين إضافية.
المرتجعات
كائن مهمة الكشف عن كائن الصورة الذي يمكن إرساله إلى حساب التعلم الآلي من Microsoft Azure للتنفيذ.
نوع الإرجاع
regression
دالة لإنشاء مهمة انحدار.
يتم استخدام مهمة الانحدار لتدريب نموذج للتنبؤ بالقيم المستمرة لمتغير هدف من مجموعة بيانات. يتم تدريب نماذج مختلفة باستخدام بيانات التدريب. يتم تحديد النموذج الذي يحتوي على أفضل أداء على بيانات التحقق من الصحة استنادا إلى المقياس الأساسي كنموذج نهائي.
regression(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> RegressionJob
المعلمات
- training_data
- Input
بيانات التدريب التي سيتم استخدامها داخل التجربة. يجب أن يحتوي على كل من ميزات التدريب وعمود التسمية (اختياريا عمود أوزان العينة).
- target_column_name
- str
اسم عمود التسمية.
تنطبق هذه المعلمة على training_data
validation_data
المعلمات و test_data
- primary_metric
المقياس الذي سيحسنه التعلم الآلي التلقائي لاختيار النموذج. يجمع التعلم الآلي التلقائي مقاييس أكثر مما يمكن تحسينه. لمزيد من المعلومات حول كيفية حساب المقاييس، راجع https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
القيم المقبولة: spearman_correlation، r2_score، normalized_mean_absolute_error، normalized_root_mean_squared_error. الإعدادات الافتراضية normalized_root_mean_squared_error
- enable_model_explainability
- bool
ما إذا كان سيتم تمكين شرح أفضل نموذج AutoML في نهاية جميع تكرارات تدريب AutoML. الإعداد الافتراضي هو لا شيء. لمزيد من المعلومات، راجع قابلية التفسير: تفسيرات النموذج في التعلم الآلي التلقائي.
- weight_column_name
- str
اسم عمود وزن العينة. يدعم التعلم الآلي التلقائي عمودا مرجحا كإدخل، ما يتسبب في ترجيح الصفوف في البيانات لأعلى أو لأسفل. إذا كانت بيانات الإدخال من pandas. DataFrame الذي لا يحتوي على أسماء أعمدة، يمكن استخدام مؤشرات الأعمدة بدلا من ذلك، مع التعبير عنها كأعداد صحيحة.
هذه المعلمة قابلة للتطبيق على training_data
المعلمات و validation_data
- validation_data
- Input
بيانات التحقق من الصحة التي سيتم استخدامها داخل التجربة. يجب أن يحتوي على كل من ميزات التدريب وعمود التسمية (اختياريا عمود أوزان العينة).
الإعدادات الافتراضية إلى بلا
- validation_data_size
- float
ما هو جزء البيانات المطلوب الاحتفاظ به للتحقق من الصحة عند عدم تحديد بيانات التحقق من صحة المستخدم. يجب أن يكون هذا بين 0.0 و1.0 غير شامل.
حدد validation_data
لتوفير بيانات التحقق من الصحة، أو تعيين n_cross_validations
أو validation_data_size
لاستخراج بيانات التحقق من الصحة من بيانات التدريب المحددة.
بالنسبة إلى طية التحقق المقطعي المخصصة، استخدم cv_split_column_names
.
لمزيد من المعلومات، راجع تكوين تقسيمات البيانات والتحقق المتبادل في التعلم الآلي التلقائي.
الإعدادات الافتراضية إلى بلا
كم عدد عمليات التحقق المتقاطعة التي يجب إجراؤها عند عدم تحديد بيانات التحقق من صحة المستخدم.
حدد validation_data
لتوفير بيانات التحقق من الصحة، أو تعيين n_cross_validations
أو validation_data_size
لاستخراج بيانات التحقق من الصحة من بيانات التدريب المحددة.
بالنسبة إلى طية التحقق المقطعي المخصصة، استخدم cv_split_column_names
.
لمزيد من المعلومات، راجع تكوين تقسيمات البيانات والتحقق المتبادل في التعلم الآلي التلقائي.
الإعدادات الافتراضية إلى بلا
قائمة بأسماء الأعمدة التي تحتوي على تقسيم مخصص للتحقق من الصحة المتقاطع. يمثل كل عمود من أعمدة تقسيم CV تقسيم سيرة ذاتية واحد حيث يتم وضع علامة على كل صف إما 1 للتدريب أو 0 للتحقق من الصحة.
الإعدادات الافتراضية إلى بلا
- test_data
- Input
ميزة اختبار النموذج باستخدام مجموعات بيانات الاختبار أو تقسيم بيانات الاختبار هي ميزة في حالة المعاينة وقد تتغير في أي وقت. بيانات الاختبار التي سيتم استخدامها لتشغيل اختبار سيتم بدء تشغيله تلقائيا بعد اكتمال تدريب النموذج. سيحصل تشغيل الاختبار على تنبؤات باستخدام أفضل نموذج وسيحسب المقاييس نظرا لهذه التنبؤات.
إذا لم يتم تحديد هذه المعلمة أو المعلمة test_data_size
، فلن يتم تنفيذ أي تشغيل اختبار تلقائيا بعد اكتمال تدريب النموذج.
يجب أن تحتوي بيانات الاختبار على كل من الميزات وعمود التسمية.
إذا test_data
تم تحديد ثم target_column_name
يجب تحديد المعلمة.
الإعدادات الافتراضية إلى بلا
- test_data_size
- float
ميزة اختبار النموذج باستخدام مجموعات بيانات الاختبار أو تقسيم بيانات الاختبار هي ميزة في حالة المعاينة وقد تتغير في أي وقت. ما هو جزء من بيانات التدريب التي يجب الاحتفاظ بها لبيانات الاختبار لتشغيل اختبار سيتم تشغيله تلقائيا بعد اكتمال تدريب النموذج. سيحصل تشغيل الاختبار على تنبؤات باستخدام أفضل نموذج وسيحسب المقاييس نظرا لهذه التنبؤات.
يجب أن يكون هذا بين 0.0 و1.0 غير شامل.
إذا test_data_size
تم تحديد في نفس الوقت مثل validation_data_size
، فسيتم تقسيم بيانات الاختبار من قبل تقسيم بيانات التحقق من training_data
الصحة.
على سبيل المثال، إذا كانت validation_data_size=0.1
test_data_size=0.1
بيانات التدريب الأصلية تحتوي على 1000 صف، فسيكون لبيانات الاختبار 100 صف، وستحتوي بيانات التحقق من الصحة على 90 صفا وسيكون لبيانات التدريب 810 صفوف.
بالنسبة للمهام المستندة إلى الانحدار، يتم استخدام أخذ العينات العشوائية. بالنسبة لمهام التصنيف، يتم استخدام أخذ العينات الطبقية. لا يدعم التنبؤ حاليا تحديد مجموعة بيانات اختبار باستخدام تقسيم تدريب/اختبار.
إذا لم يتم تحديد هذه المعلمة أو المعلمة test_data
، فلن يتم تنفيذ أي تشغيل اختبار تلقائيا بعد اكتمال تدريب النموذج.
الإعدادات الافتراضية إلى بلا
المرتجعات
كائن مهمة يمكن إرساله إلى حساب التعلم الآلي من Microsoft Azure للتنفيذ.
نوع الإرجاع
text_classification
دالة لإنشاء TextClassificationJob.
يتم استخدام مهمة تصنيف النص لتدريب نموذج يمكنه التنبؤ بفئة/فئة البيانات النصية. يجب أن تتضمن بيانات تدريب الإدخال عمودا مستهدفا يصنف النص إلى فئة واحدة بالضبط.
text_classification(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationJob
المعلمات
- training_data
- Input
بيانات التدريب التي سيتم استخدامها داخل التجربة. يجب أن يحتوي على كل من ميزات التدريب والعمود الهدف.
- target_column_name
- str
اسم العمود الهدف.
- validation_data
- Input
بيانات التحقق من الصحة التي سيتم استخدامها داخل التجربة. يجب أن يحتوي على كل من ميزات التدريب والعمود الهدف.
- primary_metric
- Union[str, ClassificationPrimaryMetrics]
المقياس الأساسي للمهمة. القيم المقبولة: الدقة، AUC_weighted، precision_score_weighted
- log_verbosity
- str
مستوى الإسهاب في السجل.
- kwargs
- dict
قاموس معلمات تكوين إضافية.
المرتجعات
عنصر TextClassificationJob.
نوع الإرجاع
text_classification_multilabel
دالة لإنشاء TextClassificationMultilabelJob.
يتم استخدام مهمة متعددة التسميات لتصنيف النص لتدريب نموذج يمكنه التنبؤ بفئات/فئات البيانات النصية. يجب أن تتضمن بيانات تدريب الإدخال عمودا مستهدفا يصنف النص إلى فئة (فئات). لمزيد من المعلومات حول تنسيق البيانات متعددة التسميات، راجع: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#multi-label
text_classification_multilabel(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationMultilabelJob
المعلمات
- training_data
- Input
بيانات التدريب التي سيتم استخدامها داخل التجربة. يجب أن يحتوي على كل من ميزات التدريب والعمود الهدف.
- target_column_name
- str
اسم العمود الهدف.
- validation_data
- Input
بيانات التحقق من الصحة التي سيتم استخدامها داخل التجربة. يجب أن يحتوي على كل من ميزات التدريب والعمود الهدف.
- primary_metric
- str
المقياس الأساسي للمهمة. القيم المقبولة: الدقة
- log_verbosity
- str
مستوى الإسهاب في السجل.
- kwargs
- dict
قاموس معلمات تكوين إضافية.
المرتجعات
عنصر TextClassificationMultilabelJob.
نوع الإرجاع
text_ner
دالة لإنشاء TextNerJob.
يتم استخدام مهمة التعرف على الكيان المسماة لتدريب نموذج يمكنه التنبؤ بالكيانات المسماة في النص. يجب أن تكون بيانات تدريب الإدخال ملفا نصيا بتنسيق CoNLL. لمزيد من المعلومات حول تنسيق بيانات NER النصية، راجع: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#named-entity-recognition-ner
text_ner(*, training_data: Input, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextNerJob
المعلمات
- training_data
- Input
بيانات التدريب التي سيتم استخدامها داخل التجربة. يجب أن يحتوي على كل من ميزات التدريب والعمود الهدف.
- validation_data
- Input
بيانات التحقق من الصحة التي سيتم استخدامها داخل التجربة. يجب أن يحتوي على كل من ميزات التدريب والعمود الهدف.
- primary_metric
- str
المقياس الأساسي للمهمة. القيم المقبولة: الدقة
- log_verbosity
- str
مستوى الإسهاب في السجل.
- kwargs
- dict
قاموس معلمات تكوين إضافية.
المرتجعات
كائن TextNerJob.
نوع الإرجاع
Azure SDK for Python