ClassificationJob الفصل

‏‏المرجع

تكوين مهمة تصنيف AutoML.

تهيئة مهمة تصنيف AutoML جديدة.

توريث: azure.ai.ml.entities._job.automl.tabular.automl_tabular.AutoMLTabular

ClassificationJob

الدالمنشئ

ClassificationJob(*, primary_metric: str | None = None, positive_label: str | None = None, **kwargs)

المعلمات

primary_metric: Optional[str]

المقياس الأساسي الذي يجب استخدامه للتحسين، يتم تعيينه افتراضيا إلى بلا

positive_label: Optional[str]

تسمية إيجابية لحساب المقاييس الثنائية، الإعدادات الافتراضية إلى بلا

featurization: Optional[TabularFeaturizationSettings]

إعدادات التمييز. الإعدادات الافتراضية إلى بلا.

limits: Optional[TabularLimitSettings]

تحديد الإعدادات. الإعدادات الافتراضية إلى بلا.

training: Optional[TrainingSettings]

إعدادات التدريب. الإعدادات الافتراضية إلى بلا.

primary_metric: Optional[str]

المقياس الأساسي الذي يجب استخدامه للتحسين، يتم تعيينه افتراضيا إلى بلا

positive_label: Optional[str]

تسمية إيجابية لحساب المقاييس الثنائية، الإعدادات الافتراضية إلى بلا

featurization: Optional[TabularFeaturizationSettings]

إعدادات التمييز. الإعدادات الافتراضية إلى بلا.

limits: Optional[TabularLimitSettings]

حدود الإعدادات. الإعدادات الافتراضية إلى بلا.

training: Optional[TrainingSettings]

إعدادات التدريب. الإعدادات الافتراضية إلى بلا.

الأساليب

dump	تفريغ محتوى المهمة في ملف بتنسيق YAML.
set_data	تعريف تكوين البيانات.
set_featurization	تعريف تكوين هندسة الميزات.
set_limits	تعيين حدود للوظيفة.
set_training	أسلوب تكوين الإعدادات ذات الصلة بالتدريب.

dump

تفريغ محتوى المهمة في ملف بتنسيق YAML.

dump(dest: str | PathLike | IO, **kwargs) -> None

المعلمات

dest: Union[<xref:PathLike>, str, IO[AnyStr]]

مطلوب

المسار المحلي أو دفق الملف لكتابة محتوى YAML إليه. إذا كان dest مسار ملف، فسيتم إنشاء ملف جديد. إذا كان dest ملفا مفتوحا، فستتم كتابة الملف مباشرة.

kwargs: dict

وسيطات إضافية لتمريرها إلى مسلسل YAML.

استثناءات

FileExistsError

يرفع إذا كان dest هو مسار ملف والملف موجود بالفعل.

IOError

يرفع إذا كان dest ملفا مفتوحا وكان الملف غير قابل للكتابة.

set_data

تعريف تكوين البيانات.

set_data(*, training_data: Input, target_column_name: str, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None) -> None

المعلمات

training_data: Input

بيانات التدريب.

target_column_name: str

اسم العمود للعمود الهدف.

weight_column_name: Optional[str]

اسم عمود الوزن، الإعدادات الافتراضية إلى بلا

validation_data: Optional[Input]

بيانات التحقق من الصحة، الإعدادات الافتراضية إلى بلا

validation_data_size: Optional[float]

حجم بيانات التحقق من الصحة، يتم تعيينه افتراضيا إلى بلا

n_cross_validations: Optional[Union[str, int]]

n_cross_validations، الإعدادات الافتراضية إلى بلا

cv_split_column_names: Optional[List[str]]

cv_split_column_names، الإعدادات الافتراضية إلى بلا

test_data: Optional[Input]

اختبار البيانات، الإعدادات الافتراضية إلى بلا

test_data_size: Optional[float]

اختبار حجم البيانات، الإعدادات الافتراضية إلى بلا

استثناءات

FileExistsError

يرفع إذا كان dest هو مسار ملف والملف موجود بالفعل.

IOError

يرفع إذا كان dest ملفا مفتوحا وكان الملف غير قابل للكتابة.

set_featurization

تعريف تكوين هندسة الميزات.

set_featurization(*, blocked_transformers: List[BlockedTransformers | str] | None = None, column_name_and_types: Dict[str, str] | None = None, dataset_language: str | None = None, transformer_params: Dict[str, List[ColumnTransformer]] | None = None, mode: str | None = None, enable_dnn_featurization: bool | None = None) -> None

المعلمات

blocked_transformers: Optional[List[Union[BlockedTransformers, str]]]

قائمة بأسماء المحولات التي سيتم حظرها أثناء التمييز، يتم تعيينها افتراضيا إلى بلا

column_name_and_types: Optional[Dict[str, str]]

قاموس لأسماء الأعمدة وأنواع الميزات المستخدمة لتحديث الغرض من العمود ، يتم تعيينه افتراضيا إلى بلا

dataset_language: Optional[str]

ثلاثة أحرف رمز ISO 639-3 للغة (اللغات) المضمنة في مجموعة البيانات. يتم دعم لغات أخرى غير الإنجليزية فقط إذا كنت تستخدم الحوسبة التي تدعم GPU. يجب استخدام language_code "mul" إذا كانت مجموعة البيانات تحتوي على لغات متعددة. للعثور على رموز ISO 639-3 للغات مختلفة، يرجى الرجوع إلى https://en.wikipedia.org/wiki/List_of_ISO_639-3_codes، الإعدادات الافتراضية إلى بلا

transformer_params: Optional[Dict[str, List[ColumnTransformer]]]

قاموس المحول ومعلمات التخصيص المقابلة ، والإعدادات الافتراضية إلى بلا

mode: Optional[str]

"إيقاف تشغيل"، "تلقائي"، افتراضي إلى "تلقائي"، افتراضي إلى بلا

enable_dnn_featurization: Optional[bool]

ما إذا كنت تريد تضمين أساليب هندسة الميزات المستندة إلى DNN، الإعدادات الافتراضية إلى بلا

استثناءات

FileExistsError

يرفع إذا كان dest هو مسار ملف والملف موجود بالفعل.

IOError

يرفع إذا كان dest ملفا مفتوحا وكان الملف غير قابل للكتابة.

set_limits

تعيين حدود للوظيفة.

set_limits(*, enable_early_termination: bool | None = None, exit_score: float | None = None, max_concurrent_trials: int | None = None, max_cores_per_trial: int | None = None, max_nodes: int | None = None, max_trials: int | None = None, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None

المعلمات

enable_early_termination: Optional[bool]

ما إذا كنت تريد تمكين الإنهاء المبكر إذا لم تتحسن النتيجة على المدى القصير، يتم تعيينها افتراضيا إلى None.

منطق الإيقاف المبكر:

لا يوجد توقف مبكر لأول 20 تكرارا (معالم).
تبدأ نافذة الإيقاف المبكر في التكرار الحادي والعشرين وتبحث عن التكرارات early_stopping_n_iters

(معين حاليا على 10). وهذا يعني أن التكرار الأول حيث يمكن أن يحدث التوقف هو 31.
لا يزال AutoML يقوم بجدولة 2 تكرارات بعد الإيقاف المبكر، مما قد يؤدي إلى درجات أعلى.
يتم تشغيل الإيقاف المبكر إذا كانت القيمة المطلقة لأفضل درجة محسوبة هي نفسها في الماضي

early_stopping_n_iters التكرارات، أي إذا لم يكن هناك تحسن في درجة التكرارات early_stopping_n_iters.

exit_score: Optional[float]

درجة الهدف للتجربة. تنتهي التجربة بعد الوصول إلى هذه النتيجة. إذا لم يتم تحديدها (بدون معايير)، يتم تشغيل التجربة حتى لا يتم إحراز أي تقدم إضافي على المقياس الأساسي. لمزيد من المعلومات حول معايير الخروج، راجع هذه المقالة ، الإعدادات الافتراضية إلى بلا

max_concurrent_trials: Optional[int]

هذا هو الحد الأقصى لعدد التكرارات التي سيتم تنفيذها بالتوازي. القيمة الافتراضية هي 1.

تدعم مجموعات AmlCompute تكرارا واحدا يعمل لكل عقدة.

بالنسبة لعمليات التشغيل الأصلية لتجربة AutoML المتعددة التي يتم تنفيذها بالتوازي على مجموعة AmlCompute واحدة، يجب أن يكون مجموع max_concurrent_trials القيم لجميع التجارب أقل من أو يساوي الحد الأقصى لعدد العقد. وإلا، سيتم وضع عمليات التشغيل في قائمة الانتظار حتى تتوفر العقد.

يدعم DSVM تكرارات متعددة لكل عقدة. max_concurrent_trials ان

يكون أقل من أو يساوي عدد الذاكرات الأساسية على DSVM. بالنسبة للتجارب المتعددة التي يتم تشغيلها بالتوازي على DSVM واحد، يجب أن يكون مجموع max_concurrent_trials القيم لجميع التجارب أقل من أو يساوي الحد الأقصى لعدد العقد.

Databricks - max_concurrent_trials يجب أن يكون أقل من أو يساوي عدد

عقد العامل على Databricks.

max_concurrent_trials لا ينطبق على عمليات التشغيل المحلية. سابقا، تمت تسمية concurrent_iterationsهذه المعلمة .

max_cores_per_trial: Optional[int]

الحد الأقصى لعدد مؤشرات الترابط التي يجب استخدامها لتكرار تدريب معين. القيم المقبولة:

أكبر من 1 وأقل من أو يساوي الحد الأقصى لعدد الذاكرات الأساسية على هدف الحساب.
يساوي -1، مما يعني استخدام جميع الذاكرات الأساسية الممكنة لكل تكرار لكل تشغيل تابع.
يساوي 1، الافتراضي.

max_nodes: Optional[int]

[تجريبي] الحد الأقصى لعدد العقد التي يجب استخدامها للتدريب الموزع.

للتنبؤ، يتم تدريب كل نموذج باستخدام عقد max(2, int(max_nodes / max_concurrent_trials)).
للتصنيف/الانحدار، يتم تدريب كل نموذج باستخدام العقد max_nodes.

ملاحظة- هذه المعلمة في المعاينة العامة وقد تتغير في المستقبل.

max_trials: Optional[int]

العدد الإجمالي لمجموعات الخوارزمية والمعلمات المختلفة لاختبارها أثناء تجربة التعلم الآلي التلقائي. إذا لم يتم تحديده، يكون الافتراضي هو 1000 تكرار.

timeout_minutes: Optional[int]

الحد الأقصى لمقدار الوقت بالدقائق التي يمكن أن تستغرقها جميع التكرارات مجتمعة قبل إنهاء التجربة. إذا لم يتم تحديدها، فإن مهلة التجربة الافتراضية هي 6 أيام. لتحديد مهلة أقل من ساعة واحدة أو مساوية لها، تأكد من أن حجم مجموعة البيانات ليس أكبر من 10,000,000 (عمود أوقات الصفوف) أو نتائج خطأ، يتم تعيينه افتراضيا إلى بلا

trial_timeout_minutes: Optional[int]

الحد الأقصى للوقت بالدقائق الذي يمكن تشغيل كل تكرار له قبل إنهائه. إذا لم يتم تحديدها، يتم استخدام قيمة شهر واحد أو 43200 دقيقة، يتم تعيينها افتراضيا إلى بلا

استثناءات

FileExistsError

يرفع إذا كان dest هو مسار ملف والملف موجود بالفعل.

IOError

يرفع إذا كان dest ملفا مفتوحا وكان الملف غير قابل للكتابة.

set_training

أسلوب تكوين الإعدادات ذات الصلة بالتدريب.

set_training(*, enable_onnx_compatible_models: bool | None = None, enable_dnn_training: bool | None = None, enable_model_explainability: bool | None = None, enable_stack_ensemble: bool | None = None, enable_vote_ensemble: bool | None = None, stack_ensemble_settings: StackEnsembleSettings | None = None, ensemble_model_download_timeout: int | None = None, allowed_training_algorithms: List[str] | None = None, blocked_training_algorithms: List[str] | None = None, training_mode: str | TrainingMode | None = None) -> None

المعلمات

enable_onnx_compatible_models: Optional[bool]

ما إذا كنت تريد تمكين أو تعطيل فرض النماذج المتوافقة مع ONNX. الافتراضي هو False. لمزيد من المعلومات حول Open Neural Network Exchange (ONNX) والتعلم الآلي من Microsoft Azure، راجع هذه المقالة.

enable_dnn_training: Optional[bool]

ما إذا كنت تريد تضمين نماذج تستند إلى DNN أثناء تحديد النموذج. ومع ذلك، الافتراضي هو True لمهام DNN NLP، وهو False لجميع مهام AutoML الأخرى.

enable_model_explainability: Optional[bool]

ما إذا كنت تريد تمكين شرح أفضل نموذج AutoML في نهاية جميع تكرارات تدريب AutoML. لمزيد من المعلومات، راجع قابلية التفسير: تفسيرات النموذج في التعلم الآلي التلقائي. ، الإعدادات الافتراضية إلى بلا

enable_stack_ensemble: Optional[bool]

ما إذا كنت تريد تمكين/تعطيل تكرار StackEnsemble. إذا تم تعيين علامة enable_onnx_compatible_models ، فسيتم تعطيل تكرار StackEnsemble. وبالمثل، بالنسبة لمهام Timeseries، سيتم تعطيل تكرار StackEnsemble بشكل افتراضي، لتجنب مخاطر الإفراط في الإعداد بسبب مجموعة التدريب الصغيرة المستخدمة في ملاءمة متعلم التعريف. لمزيد من المعلومات حول الفرق، راجع تكوين المجموعة ، الإعدادات الافتراضية إلى بلا

enable_vote_ensemble: Optional[bool]

ما إذا كان يجب تمكين/تعطيل تكرار VotingEnsemble. لمزيد من المعلومات حول الفرق، راجع تكوين المجموعة ، الإعدادات الافتراضية إلى بلا

stack_ensemble_settings: Optional[StackEnsembleSettings]

إعدادات تكرار StackEnsemble، الإعدادات الافتراضية إلى بلا

ensemble_model_download_timeout: Optional[int]

أثناء إنشاء نموذج VotingEnsemble و StackEnsemble، يتم تنزيل نماذج متعددة مزودة من عمليات التشغيل الفرعية السابقة. تكوين هذه المعلمة بقيمة أعلى من 300 ثانية، إذا كانت هناك حاجة إلى مزيد من الوقت، يتم تعيينها افتراضيا إلى بلا

allowed_training_algorithms: Optional[List[str]]

قائمة بأسماء النماذج للبحث عن تجربة. إذا لم يتم تحديدها، فسيتم استخدام جميع النماذج المدعومة للمهمة مطروحا منها أي نماذج TensorFlow محددة أو blocked_training_algorithms مهملة، افتراضية إلى بلا

blocked_training_algorithms: Optional[List[str]]

قائمة الخوارزميات التي يجب تجاهلها لتجربة ما، يتم تعيينها افتراضيا إلى بلا

training_mode: Optional[Union[str, TabularTrainingMode]]

[تجريبي] وضع التدريب المراد استخدامه. القيم المحتملة هي-

موزع- يتيح التدريب الموزع للخوارزميات المدعومة.
non_distributed- يعطل التدريب الموزع.
تلقائي- حاليا، هو نفس non_distributed. في المستقبل، قد يتغير هذا.

ملاحظة: هذه المعلمة في المعاينة العامة وقد تتغير في المستقبل.

استثناءات

FileExistsError

يرفع إذا كان dest هو مسار ملف والملف موجود بالفعل.

IOError

يرفع إذا كان dest ملفا مفتوحا وكان الملف غير قابل للكتابة.

Optional[str]

<xref:LogVerbosity>

outputs

primary_metric

المقياس الأساسي الذي يجب استخدامه للتحسين.

المرتجعات

المقياس الأساسي الذي يجب استخدامه للتحسين.

نوع الإرجاع

Union[str, ClassificationPrimaryMetrics]

status

حالة الوظيفة.

تتضمن القيم الشائعة التي تم إرجاعها "قيد التشغيل" و"مكتمل" و"فشل". جميع القيم المحتملة هي:

NotStarted - هذه حالة مؤقتة تكون فيها كائنات التشغيل من جانب العميل قبل إرسال السحابة.
البدء - بدأ التشغيل في المعالجة في السحابة. لدى المتصل معرف تشغيل في هذه المرحلة.
التوفير - يتم إنشاء حساب عند الطلب لتقديم وظيفة معينة.
التحضير - يتم إعداد بيئة التشغيل وهي في إحدى مرحلتين:
- بناء صورة Docker
- إعداد بيئة conda
في قائمة الانتظار - يتم وضع المهمة في قائمة الانتظار على هدف الحساب. على سبيل المثال، في BatchAI، تكون المهمة في حالة قائمة الانتظار

أثناء انتظار أن تكون جميع العقد المطلوبة جاهزة.
قيد التشغيل - بدأت المهمة في التشغيل على هدف الحساب.
إنهاء - اكتمل تنفيذ التعليمات البرمجية للمستخدم، والتشغيل في مراحل ما بعد المعالجة.
CancelRequested - تم طلب الإلغاء للوظيفة.
مكتمل - اكتمل التشغيل بنجاح. يتضمن ذلك كلا من تنفيذ التعليمات البرمجية للمستخدم وتشغيله

مراحل ما بعد المعالجة.
فشل - فشل التشغيل. عادة ما توفر الخاصية Error أثناء التشغيل تفاصيل حول السبب.
تم الإلغاء - يتبع طلب إلغاء ويشير إلى أن التشغيل قد تم إلغاؤه بنجاح الآن.
NotResponding - بالنسبة إلى عمليات التشغيل التي تم تمكين Heartbeats فيها، لم يتم إرسال رسالة كشف أخطاء الاتصال مؤخرا.

الدالمنشئ

المعلمات

الأساليب

dump

المعلمات

استثناءات

set_data

المعلمات

استثناءات

set_featurization

المعلمات

استثناءات

set_limits

المعلمات

استثناءات

set_training

المعلمات

استثناءات

السمات

base_path

المرتجعات

نوع الإرجاع

creation_context

المرتجعات

نوع الإرجاع

featurization

المرتجعات

نوع الإرجاع

id

المرتجعات

نوع الإرجاع

inputs

limits

المرتجعات

نوع الإرجاع

log_files

المرتجعات

نوع الإرجاع

log_verbosity

المرتجعات

نوع الإرجاع

outputs

primary_metric

المرتجعات

نوع الإرجاع

status

المرتجعات

نوع الإرجاع

studio_url

المرتجعات

نوع الإرجاع

task_type

المرتجعات

نوع الإرجاع

test_data

المرتجعات

نوع الإرجاع

training

المرتجعات

نوع الإرجاع

training_data

المرتجعات

نوع الإرجاع

type

المرتجعات

نوع الإرجاع

validation_data

المرتجعات

نوع الإرجاع

الملاحظات

الموارد الإضافية