TextClassificationJob الفصل

تكوين مهمة تصنيف نص AutoML.

تهيئة مهمة تصنيف نص AutoML جديدة.

توريث
azure.ai.ml.entities._job.automl.nlp.automl_nlp_job.AutoMLNLPJob
TextClassificationJob

الدالمنشئ

TextClassificationJob(*, target_column_name: str | None = None, training_data: Input | None = None, validation_data: Input | None = None, primary_metric: ClassificationPrimaryMetrics | None = None, log_verbosity: str | None = None, **kwargs)

المعلمات

target_column_name
مطلوب

اسم العمود الهدف

training_data
مطلوب

بيانات التدريب التي سيتم استخدامها للتدريب

validation_data
مطلوب

بيانات التحقق من الصحة التي سيتم استخدامها لتقييم النموذج المدرب

primary_metric
مطلوب

المقياس الأساسي الذي سيتم عرضه

log_verbosity
مطلوب

مستوى إسهاب السجل

kwargs
مطلوب

وسيطات خاصة بالوظيفة

الأساليب

dump

تفريغ محتوى المهمة في ملف بتنسيق YAML.

extend_search_space

أضف (أ) مساحة (مساحات) بحث لوظيفة AutoML NLP هذه.

set_data
set_featurization
set_limits
set_sweep

إعدادات المسح لجميع مهام AutoML NLP.

set_training_parameters

إصلاح معلمات تدريب معينة طوال إجراء التدريب لجميع المرشحين.

تمرير. يجب أن يكون هذا عددا صحيحا موجبا. :الكلمة الأساسية learning_rate: معدل التعلم الأولي. يجب أن يكون عائما في (0، 1). :الكلمة الأساسية learning_rate_scheduler: نوع مجدول معدل التعلم. يجب الاختيار من بين "خطي" و"جيب التمام" و"cosine_with_restarts" و"متعدد الحدود" و"ثابت" و"constant_with_warmup". :الكلمة الأساسية model_name: اسم النموذج المراد استخدامه أثناء التدريب. يجب أن تختار من بين "bert-base-cased"، "bert-base-uncased"، "bert-base-multilingual-cased"، "bert-base-german-cased"، "bert-large-cased"، 'bert-large-uncased', 'distilbert-base-cased', 'distilbert-base-uncased', 'roberta-base', 'roberta-large', 'distilroberta-base', 'xlm-roberta-base', 'xlm-roberta-large', xlnet-base-cased', و'xlnet-large-cased'. :الكلمة الأساسية number_of_epochs: عدد الفترات التي يجب التدريب بها. يجب أن تكون عدداً صحيحاً موجباً. :الكلمة الأساسية training_batch_size: حجم الدفعة أثناء التدريب. يجب أن تكون عدداً صحيحاً موجباً. :الكلمة الأساسية validation_batch_size: حجم الدفعة أثناء التحقق من الصحة. يجب أن تكون عدداً صحيحاً موجباً. :الكلمة الأساسية warmup_ratio: نسبة إجمالي خطوات التدريب المستخدمة لإعداد خطي من 0 إلى learning_rate. يجب أن يكون عائما في [0، 1]. :الكلمة الأساسية weight_decay: قيمة تسوس الوزن عندما يكون المحسن sgd أو adam أو adamw. يجب أن يكون هذا عائما في النطاق [0، 1]. :return: None.

dump

تفريغ محتوى المهمة في ملف بتنسيق YAML.

dump(dest: str | PathLike | IO, **kwargs) -> None

المعلمات

dest
Union[<xref:PathLike>, str, IO[AnyStr]]
مطلوب

المسار المحلي أو دفق الملف لكتابة محتوى YAML إليه. إذا كان dest مسار ملف، فسيتم إنشاء ملف جديد. إذا كان dest ملفا مفتوحا، فستتم كتابة الملف مباشرة.

kwargs
dict

وسيطات إضافية لتمريرها إلى مسلسل YAML.

استثناءات

يرفع إذا كان dest هو مسار ملف والملف موجود بالفعل.

يرفع إذا كان dest ملفا مفتوحا وكان الملف غير قابل للكتابة.

extend_search_space

أضف (أ) مساحة (مساحات) بحث لوظيفة AutoML NLP هذه.

extend_search_space(value: SearchSpace | List[SearchSpace]) -> None

المعلمات

value
Union[SearchSpace, List[SearchSpace]]
مطلوب

إما كائن SearchSpace أو قائمة كائنات SearchSpace مع معلمات خاصة ب nlp.

المرتجعات

لا شيء

استثناءات

يرفع إذا كان dest هو مسار ملف والملف موجود بالفعل.

يرفع إذا كان dest ملفا مفتوحا وكان الملف غير قابل للكتابة.

set_data

set_data(*, training_data: Input, target_column_name: str, validation_data: Input) -> None

استثناءات

يرفع إذا كان dest هو مسار ملف والملف موجود بالفعل.

يرفع إذا كان dest ملفا مفتوحا وكان الملف غير قابل للكتابة.

set_featurization

set_featurization(*, dataset_language: str | None = None) -> None

استثناءات

يرفع إذا كان dest هو مسار ملف والملف موجود بالفعل.

يرفع إذا كان dest ملفا مفتوحا وكان الملف غير قابل للكتابة.

set_limits

set_limits(*, max_trials: int = 1, max_concurrent_trials: int = 1, max_nodes: int = 1, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None

استثناءات

يرفع إذا كان dest هو مسار ملف والملف موجود بالفعل.

يرفع إذا كان dest ملفا مفتوحا وكان الملف غير قابل للكتابة.

set_sweep

إعدادات المسح لجميع مهام AutoML NLP.

set_sweep(*, sampling_algorithm: str | SamplingAlgorithmType, early_termination: EarlyTerminationPolicy | None = None)

المعلمات

sampling_algorithm

مطلوب يحدد نوع خوارزمية أخذ عينات المعلمات الفائقة. تتضمن القيم المحتملة: "Grid" و"Random" و"Bayesian".

early_termination

نهج الإنهاء المبكر الاختياري لإنهاء المرشحين للتدريب الضعيف الأداء.

المرتجعات

بلا

استثناءات

يرفع إذا كان dest هو مسار ملف والملف موجود بالفعل.

يرفع إذا كان dest ملفا مفتوحا وكان الملف غير قابل للكتابة.

set_training_parameters

إصلاح معلمات تدريب معينة طوال إجراء التدريب لجميع المرشحين.

تمرير. يجب أن يكون هذا عددا صحيحا موجبا. :الكلمة الأساسية learning_rate: معدل التعلم الأولي. يجب أن يكون عائما في (0، 1). :الكلمة الأساسية learning_rate_scheduler: نوع مجدول معدل التعلم. يجب الاختيار من بين "خطي" و"جيب التمام" و"cosine_with_restarts" و"متعدد الحدود" و"ثابت" و"constant_with_warmup". :الكلمة الأساسية model_name: اسم النموذج المراد استخدامه أثناء التدريب. يجب أن تختار من بين "bert-base-cased"، "bert-base-uncased"، "bert-base-multilingual-cased"، "bert-base-german-cased"، "bert-large-cased"، 'bert-large-uncased', 'distilbert-base-cased', 'distilbert-base-uncased', 'roberta-base', 'roberta-large', 'distilroberta-base', 'xlm-roberta-base', 'xlm-roberta-large', xlnet-base-cased', و'xlnet-large-cased'. :الكلمة الأساسية number_of_epochs: عدد الفترات التي يجب التدريب بها. يجب أن تكون عدداً صحيحاً موجباً. :الكلمة الأساسية training_batch_size: حجم الدفعة أثناء التدريب. يجب أن تكون عدداً صحيحاً موجباً. :الكلمة الأساسية validation_batch_size: حجم الدفعة أثناء التحقق من الصحة. يجب أن تكون عدداً صحيحاً موجباً. :الكلمة الأساسية warmup_ratio: نسبة إجمالي خطوات التدريب المستخدمة لإعداد خطي من 0 إلى learning_rate. يجب أن يكون عائما في [0، 1]. :الكلمة الأساسية weight_decay: قيمة تسوس الوزن عندما يكون المحسن sgd أو adam أو adamw. يجب أن يكون هذا عائما في النطاق [0، 1]. :return: None.

set_training_parameters(*, gradient_accumulation_steps: int | None = None, learning_rate: float | None = None, learning_rate_scheduler: str | NlpLearningRateScheduler | None = None, model_name: str | None = None, number_of_epochs: int | None = None, training_batch_size: int | None = None, validation_batch_size: int | None = None, warmup_ratio: float | None = None, weight_decay: float | None = None) -> None

المعلمات

gradient_accumulation_steps

عدد الخطوات التي يجب تجميع التدرجات فوقها قبل الرجوع إلى الخلف

استثناءات

يرفع إذا كان dest هو مسار ملف والملف موجود بالفعل.

يرفع إذا كان dest ملفا مفتوحا وكان الملف غير قابل للكتابة.

السمات

base_path

المسار الأساسي للمورد.

المرتجعات

المسار الأساسي للمورد.

نوع الإرجاع

str

creation_context

سياق إنشاء المورد.

المرتجعات

بيانات تعريف الإنشاء للمورد.

نوع الإرجاع

featurization

id

معرف المورد.

المرتجعات

المعرف العمومي للمورد، معرف Azure Resource Manager (ARM).

نوع الإرجاع

inputs

limits

log_files

ملفات إخراج الوظيفة.

المرتجعات

قاموس أسماء السجلات وعناوين URL.

نوع الإرجاع

log_verbosity

outputs

primary_metric

search_space

status

حالة الوظيفة.

تتضمن القيم الشائعة التي تم إرجاعها "قيد التشغيل" و"مكتمل" و"فشل". جميع القيم المحتملة هي:

  • NotStarted - هذه حالة مؤقتة تكون فيها كائنات التشغيل من جانب العميل قبل إرسال السحابة.

  • البدء - بدأ التشغيل في المعالجة في السحابة. لدى المتصل معرف تشغيل في هذه المرحلة.

  • التوفير - يتم إنشاء حساب عند الطلب لتقديم وظيفة معينة.

  • التحضير - يتم إعداد بيئة التشغيل وهي في إحدى مرحلتين:

    • بناء صورة Docker

    • إعداد بيئة conda

  • في قائمة الانتظار - يتم وضع المهمة في قائمة الانتظار على هدف الحساب. على سبيل المثال، في BatchAI، تكون المهمة في حالة قائمة الانتظار

    أثناء انتظار أن تكون جميع العقد المطلوبة جاهزة.

  • قيد التشغيل - بدأت المهمة في التشغيل على هدف الحساب.

  • إنهاء - اكتمل تنفيذ التعليمات البرمجية للمستخدم، والتشغيل في مراحل ما بعد المعالجة.

  • CancelRequested - تم طلب الإلغاء للوظيفة.

  • مكتمل - اكتمل التشغيل بنجاح. يتضمن ذلك كلا من تنفيذ التعليمات البرمجية للمستخدم وتشغيله

    مراحل ما بعد المعالجة.

  • فشل - فشل التشغيل. عادة ما توفر الخاصية Error أثناء التشغيل تفاصيل حول السبب.

  • تم الإلغاء - يتبع طلب إلغاء ويشير إلى أن التشغيل قد تم إلغاؤه بنجاح الآن.

  • NotResponding - بالنسبة إلى عمليات التشغيل التي تم تمكين Heartbeats فيها، لم يتم إرسال رسالة كشف أخطاء الاتصال مؤخرا.

المرتجعات

حالة الوظيفة.

نوع الإرجاع

studio_url

نقطة نهاية استوديو التعلم الآلي من Microsoft Azure.

المرتجعات

عنوان URL لصفحة تفاصيل الوظيفة.

نوع الإرجاع

sweep

task_type

الحصول على نوع المهمة.

المرتجعات

نوع المهمة المراد تشغيلها. تتضمن القيم المحتملة: "التصنيف"، و"الانحدار"، و"التنبؤ".

نوع الإرجاع

str

test_data

الحصول على بيانات الاختبار.

المرتجعات

اختبار إدخال البيانات

نوع الإرجاع

training_data

الحصول على بيانات التدريب.

المرتجعات

إدخال بيانات التدريب

نوع الإرجاع

training_parameters

type

نوع الوظيفة.

المرتجعات

نوع الوظيفة.

نوع الإرجاع

validation_data

الحصول على بيانات التحقق من الصحة.

المرتجعات

إدخال بيانات التحقق من الصحة

نوع الإرجاع