TextClassificationJob الفصل

‏‏المرجع

تكوين مهمة تصنيف نص AutoML.

تهيئة مهمة تصنيف نص AutoML جديدة.

توريث: azure.ai.ml.entities._job.automl.nlp.automl_nlp_job.AutoMLNLPJob

TextClassificationJob

الدالمنشئ

TextClassificationJob(*, target_column_name: str | None = None, training_data: Input | None = None, validation_data: Input | None = None, primary_metric: ClassificationPrimaryMetrics | None = None, log_verbosity: str | None = None, **kwargs)

المعلمات

target_column_name

مطلوب

اسم العمود الهدف

training_data

مطلوب

بيانات التدريب التي سيتم استخدامها للتدريب

validation_data

مطلوب

بيانات التحقق من الصحة التي سيتم استخدامها لتقييم النموذج المدرب

primary_metric

مطلوب

المقياس الأساسي الذي سيتم عرضه

log_verbosity

مطلوب

مستوى إسهاب السجل

kwargs

مطلوب

وسيطات خاصة بالوظيفة

الأساليب

dump	تفريغ محتوى المهمة في ملف بتنسيق YAML.
extend_search_space	أضف (أ) مساحة (مساحات) بحث لوظيفة AutoML NLP هذه.
set_data
set_featurization
set_limits
set_sweep	إعدادات المسح لجميع مهام AutoML NLP.
set_training_parameters	إصلاح معلمات تدريب معينة طوال إجراء التدريب لجميع المرشحين. تمرير. يجب أن يكون هذا عددا صحيحا موجبا. :الكلمة الأساسية learning_rate: معدل التعلم الأولي. يجب أن يكون عائما في (0، 1). :الكلمة الأساسية learning_rate_scheduler: نوع مجدول معدل التعلم. يجب الاختيار من بين "خطي" و"جيب التمام" و"cosine_with_restarts" و"متعدد الحدود" و"ثابت" و"constant_with_warmup". :الكلمة الأساسية model_name: اسم النموذج المراد استخدامه أثناء التدريب. يجب أن تختار من بين "bert-base-cased"، "bert-base-uncased"، "bert-base-multilingual-cased"، "bert-base-german-cased"، "bert-large-cased"، 'bert-large-uncased', 'distilbert-base-cased', 'distilbert-base-uncased', 'roberta-base', 'roberta-large', 'distilroberta-base', 'xlm-roberta-base', 'xlm-roberta-large', xlnet-base-cased', و'xlnet-large-cased'. :الكلمة الأساسية number_of_epochs: عدد الفترات التي يجب التدريب بها. يجب أن تكون عدداً صحيحاً موجباً. :الكلمة الأساسية training_batch_size: حجم الدفعة أثناء التدريب. يجب أن تكون عدداً صحيحاً موجباً. :الكلمة الأساسية validation_batch_size: حجم الدفعة أثناء التحقق من الصحة. يجب أن تكون عدداً صحيحاً موجباً. :الكلمة الأساسية warmup_ratio: نسبة إجمالي خطوات التدريب المستخدمة لإعداد خطي من 0 إلى learning_rate. يجب أن يكون عائما في [0، 1]. :الكلمة الأساسية weight_decay: قيمة تسوس الوزن عندما يكون المحسن sgd أو adam أو adamw. يجب أن يكون هذا عائما في النطاق [0، 1]. :return: None.

dump

تفريغ محتوى المهمة في ملف بتنسيق YAML.

dump(dest: str | PathLike | IO, **kwargs) -> None

المعلمات

dest: Union[<xref:PathLike>, str, IO[AnyStr]]

مطلوب

المسار المحلي أو دفق الملف لكتابة محتوى YAML إليه. إذا كان dest مسار ملف، فسيتم إنشاء ملف جديد. إذا كان dest ملفا مفتوحا، فستتم كتابة الملف مباشرة.

kwargs: dict

وسيطات إضافية لتمريرها إلى مسلسل YAML.

استثناءات

FileExistsError

يرفع إذا كان dest هو مسار ملف والملف موجود بالفعل.

IOError

يرفع إذا كان dest ملفا مفتوحا وكان الملف غير قابل للكتابة.

extend_search_space

أضف (أ) مساحة (مساحات) بحث لوظيفة AutoML NLP هذه.

extend_search_space(value: SearchSpace | List[SearchSpace]) -> None

المعلمات

value: Union[SearchSpace, List[SearchSpace]]

مطلوب

إما كائن SearchSpace أو قائمة كائنات SearchSpace مع معلمات خاصة ب nlp.

المرتجعات

لا شيء

استثناءات

FileExistsError

يرفع إذا كان dest هو مسار ملف والملف موجود بالفعل.

IOError

يرفع إذا كان dest ملفا مفتوحا وكان الملف غير قابل للكتابة.

set_data

set_data(*, training_data: Input, target_column_name: str, validation_data: Input) -> None

استثناءات

FileExistsError

يرفع إذا كان dest هو مسار ملف والملف موجود بالفعل.

IOError

يرفع إذا كان dest ملفا مفتوحا وكان الملف غير قابل للكتابة.

set_featurization

set_featurization(*, dataset_language: str | None = None) -> None

استثناءات

FileExistsError

يرفع إذا كان dest هو مسار ملف والملف موجود بالفعل.

IOError

يرفع إذا كان dest ملفا مفتوحا وكان الملف غير قابل للكتابة.

set_limits

set_limits(*, max_trials: int = 1, max_concurrent_trials: int = 1, max_nodes: int = 1, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None

استثناءات

FileExistsError

يرفع إذا كان dest هو مسار ملف والملف موجود بالفعل.

IOError

يرفع إذا كان dest ملفا مفتوحا وكان الملف غير قابل للكتابة.

set_sweep

إعدادات المسح لجميع مهام AutoML NLP.

set_sweep(*, sampling_algorithm: str | SamplingAlgorithmType, early_termination: EarlyTerminationPolicy | None = None)

المعلمات

sampling_algorithm

مطلوب يحدد نوع خوارزمية أخذ عينات المعلمات الفائقة. تتضمن القيم المحتملة: "Grid" و"Random" و"Bayesian".

early_termination

نهج الإنهاء المبكر الاختياري لإنهاء المرشحين للتدريب الضعيف الأداء.

المرتجعات

بلا

استثناءات

FileExistsError

يرفع إذا كان dest هو مسار ملف والملف موجود بالفعل.

IOError

يرفع إذا كان dest ملفا مفتوحا وكان الملف غير قابل للكتابة.

set_training_parameters

إصلاح معلمات تدريب معينة طوال إجراء التدريب لجميع المرشحين.

تمرير. يجب أن يكون هذا عددا صحيحا موجبا. :الكلمة الأساسية learning_rate: معدل التعلم الأولي. يجب أن يكون عائما في (0، 1). :الكلمة الأساسية learning_rate_scheduler: نوع مجدول معدل التعلم. يجب الاختيار من بين "خطي" و"جيب التمام" و"cosine_with_restarts" و"متعدد الحدود" و"ثابت" و"constant_with_warmup". :الكلمة الأساسية model_name: اسم النموذج المراد استخدامه أثناء التدريب. يجب أن تختار من بين "bert-base-cased"، "bert-base-uncased"، "bert-base-multilingual-cased"، "bert-base-german-cased"، "bert-large-cased"، 'bert-large-uncased', 'distilbert-base-cased', 'distilbert-base-uncased', 'roberta-base', 'roberta-large', 'distilroberta-base', 'xlm-roberta-base', 'xlm-roberta-large', xlnet-base-cased', و'xlnet-large-cased'. :الكلمة الأساسية number_of_epochs: عدد الفترات التي يجب التدريب بها. يجب أن تكون عدداً صحيحاً موجباً. :الكلمة الأساسية training_batch_size: حجم الدفعة أثناء التدريب. يجب أن تكون عدداً صحيحاً موجباً. :الكلمة الأساسية validation_batch_size: حجم الدفعة أثناء التحقق من الصحة. يجب أن تكون عدداً صحيحاً موجباً. :الكلمة الأساسية warmup_ratio: نسبة إجمالي خطوات التدريب المستخدمة لإعداد خطي من 0 إلى learning_rate. يجب أن يكون عائما في [0، 1]. :الكلمة الأساسية weight_decay: قيمة تسوس الوزن عندما يكون المحسن sgd أو adam أو adamw. يجب أن يكون هذا عائما في النطاق [0، 1]. :return: None.

set_training_parameters(*, gradient_accumulation_steps: int | None = None, learning_rate: float | None = None, learning_rate_scheduler: str | NlpLearningRateScheduler | None = None, model_name: str | None = None, number_of_epochs: int | None = None, training_batch_size: int | None = None, validation_batch_size: int | None = None, warmup_ratio: float | None = None, weight_decay: float | None = None) -> None

المعلمات

gradient_accumulation_steps

عدد الخطوات التي يجب تجميع التدرجات فوقها قبل الرجوع إلى الخلف

استثناءات

FileExistsError

يرفع إذا كان dest هو مسار ملف والملف موجود بالفعل.

IOError

يرفع إذا كان dest ملفا مفتوحا وكان الملف غير قابل للكتابة.

السمات

base_path

المسار الأساسي للمورد.

المرتجعات

المسار الأساسي للمورد.

نوع الإرجاع

str

creation_context

سياق إنشاء المورد.

المرتجعات

بيانات تعريف الإنشاء للمورد.

نوع الإرجاع

Optional[SystemData]

featurization

id

معرف المورد.

المرتجعات

المعرف العمومي للمورد، معرف Azure Resource Manager (ARM).

نوع الإرجاع

Optional[str]

inputs

limits

log_files

ملفات إخراج الوظيفة.

المرتجعات

قاموس أسماء السجلات وعناوين URL.

نوع الإرجاع

Optional[Dict[str, str]]

log_verbosity

outputs

primary_metric

search_space

status

حالة الوظيفة.

تتضمن القيم الشائعة التي تم إرجاعها "قيد التشغيل" و"مكتمل" و"فشل". جميع القيم المحتملة هي:

NotStarted - هذه حالة مؤقتة تكون فيها كائنات التشغيل من جانب العميل قبل إرسال السحابة.
البدء - بدأ التشغيل في المعالجة في السحابة. لدى المتصل معرف تشغيل في هذه المرحلة.
التوفير - يتم إنشاء حساب عند الطلب لتقديم وظيفة معينة.
التحضير - يتم إعداد بيئة التشغيل وهي في إحدى مرحلتين:
- بناء صورة Docker
- إعداد بيئة conda
في قائمة الانتظار - يتم وضع المهمة في قائمة الانتظار على هدف الحساب. على سبيل المثال، في BatchAI، تكون المهمة في حالة قائمة الانتظار

أثناء انتظار أن تكون جميع العقد المطلوبة جاهزة.
قيد التشغيل - بدأت المهمة في التشغيل على هدف الحساب.
إنهاء - اكتمل تنفيذ التعليمات البرمجية للمستخدم، والتشغيل في مراحل ما بعد المعالجة.
CancelRequested - تم طلب الإلغاء للوظيفة.
مكتمل - اكتمل التشغيل بنجاح. يتضمن ذلك كلا من تنفيذ التعليمات البرمجية للمستخدم وتشغيله

مراحل ما بعد المعالجة.
فشل - فشل التشغيل. عادة ما توفر الخاصية Error أثناء التشغيل تفاصيل حول السبب.
تم الإلغاء - يتبع طلب إلغاء ويشير إلى أن التشغيل قد تم إلغاؤه بنجاح الآن.
NotResponding - بالنسبة إلى عمليات التشغيل التي تم تمكين Heartbeats فيها، لم يتم إرسال رسالة كشف أخطاء الاتصال مؤخرا.

المرتجعات

حالة الوظيفة.

نوع الإرجاع

Optional[str]

studio_url

نقطة نهاية استوديو التعلم الآلي من Microsoft Azure.

المرتجعات

عنوان URL لصفحة تفاصيل الوظيفة.

نوع الإرجاع

Optional[str]

sweep

task_type

الحصول على نوع المهمة.

المرتجعات

نوع المهمة المراد تشغيلها. تتضمن القيم المحتملة: "التصنيف"، و"الانحدار"، و"التنبؤ".

نوع الإرجاع

str

test_data

الحصول على بيانات الاختبار.

المرتجعات

اختبار إدخال البيانات

نوع الإرجاع

Input

training_data

الحصول على بيانات التدريب.

المرتجعات

إدخال بيانات التدريب

نوع الإرجاع

Input

training_parameters

type

نوع الوظيفة.

المرتجعات

نوع الوظيفة.

نوع الإرجاع

Optional[str]

validation_data

الحصول على بيانات التحقق من الصحة.

المرتجعات

إدخال بيانات التحقق من الصحة

نوع الإرجاع

Input

مشاركة عبر

TextClassificationJob الفصل

الدالمنشئ

المعلمات

الأساليب

dump

المعلمات

استثناءات

extend_search_space

المعلمات

المرتجعات

استثناءات

set_data

استثناءات

set_featurization

استثناءات

set_limits

استثناءات

set_sweep

المعلمات

المرتجعات

استثناءات

set_training_parameters

المعلمات

استثناءات

السمات

base_path

المرتجعات

نوع الإرجاع

creation_context

المرتجعات

نوع الإرجاع

featurization

id

المرتجعات

نوع الإرجاع

inputs

limits

log_files

المرتجعات

نوع الإرجاع

log_verbosity

outputs

primary_metric

search_space

status

المرتجعات

نوع الإرجاع

studio_url

المرتجعات

نوع الإرجاع

sweep

task_type

المرتجعات

نوع الإرجاع

test_data

المرتجعات

نوع الإرجاع

training_data

المرتجعات

نوع الإرجاع

training_parameters

type

المرتجعات

نوع الإرجاع

validation_data

المرتجعات

نوع الإرجاع

الملاحظات

الموارد الإضافية