TextClassificationJob الفصل
تكوين مهمة تصنيف نص AutoML.
تهيئة مهمة تصنيف نص AutoML جديدة.
- توريث
-
azure.ai.ml.entities._job.automl.nlp.automl_nlp_job.AutoMLNLPJobTextClassificationJob
الدالمنشئ
TextClassificationJob(*, target_column_name: str | None = None, training_data: Input | None = None, validation_data: Input | None = None, primary_metric: ClassificationPrimaryMetrics | None = None, log_verbosity: str | None = None, **kwargs)
المعلمات
- target_column_name
اسم العمود الهدف
- training_data
بيانات التدريب التي سيتم استخدامها للتدريب
- validation_data
بيانات التحقق من الصحة التي سيتم استخدامها لتقييم النموذج المدرب
- primary_metric
المقياس الأساسي الذي سيتم عرضه
- log_verbosity
مستوى إسهاب السجل
- kwargs
وسيطات خاصة بالوظيفة
الأساليب
dump |
تفريغ محتوى المهمة في ملف بتنسيق YAML. |
extend_search_space |
أضف (أ) مساحة (مساحات) بحث لوظيفة AutoML NLP هذه. |
set_data | |
set_featurization | |
set_limits | |
set_sweep |
إعدادات المسح لجميع مهام AutoML NLP. |
set_training_parameters |
إصلاح معلمات تدريب معينة طوال إجراء التدريب لجميع المرشحين. تمرير. يجب أن يكون هذا عددا صحيحا موجبا. :الكلمة الأساسية learning_rate: معدل التعلم الأولي. يجب أن يكون عائما في (0، 1). :الكلمة الأساسية learning_rate_scheduler: نوع مجدول معدل التعلم. يجب الاختيار من بين "خطي" و"جيب التمام" و"cosine_with_restarts" و"متعدد الحدود" و"ثابت" و"constant_with_warmup". :الكلمة الأساسية model_name: اسم النموذج المراد استخدامه أثناء التدريب. يجب أن تختار من بين "bert-base-cased"، "bert-base-uncased"، "bert-base-multilingual-cased"، "bert-base-german-cased"، "bert-large-cased"، 'bert-large-uncased', 'distilbert-base-cased', 'distilbert-base-uncased', 'roberta-base', 'roberta-large', 'distilroberta-base', 'xlm-roberta-base', 'xlm-roberta-large', xlnet-base-cased', و'xlnet-large-cased'. :الكلمة الأساسية number_of_epochs: عدد الفترات التي يجب التدريب بها. يجب أن تكون عدداً صحيحاً موجباً. :الكلمة الأساسية training_batch_size: حجم الدفعة أثناء التدريب. يجب أن تكون عدداً صحيحاً موجباً. :الكلمة الأساسية validation_batch_size: حجم الدفعة أثناء التحقق من الصحة. يجب أن تكون عدداً صحيحاً موجباً. :الكلمة الأساسية warmup_ratio: نسبة إجمالي خطوات التدريب المستخدمة لإعداد خطي من 0 إلى learning_rate. يجب أن يكون عائما في [0، 1]. :الكلمة الأساسية weight_decay: قيمة تسوس الوزن عندما يكون المحسن sgd أو adam أو adamw. يجب أن يكون هذا عائما في النطاق [0، 1]. :return: None. |
dump
تفريغ محتوى المهمة في ملف بتنسيق YAML.
dump(dest: str | PathLike | IO, **kwargs) -> None
المعلمات
المسار المحلي أو دفق الملف لكتابة محتوى YAML إليه. إذا كان dest مسار ملف، فسيتم إنشاء ملف جديد. إذا كان dest ملفا مفتوحا، فستتم كتابة الملف مباشرة.
- kwargs
- dict
وسيطات إضافية لتمريرها إلى مسلسل YAML.
استثناءات
يرفع إذا كان dest هو مسار ملف والملف موجود بالفعل.
يرفع إذا كان dest ملفا مفتوحا وكان الملف غير قابل للكتابة.
extend_search_space
أضف (أ) مساحة (مساحات) بحث لوظيفة AutoML NLP هذه.
extend_search_space(value: SearchSpace | List[SearchSpace]) -> None
المعلمات
- value
- Union[SearchSpace, List[SearchSpace]]
إما كائن SearchSpace أو قائمة كائنات SearchSpace مع معلمات خاصة ب nlp.
المرتجعات
لا شيء
استثناءات
يرفع إذا كان dest هو مسار ملف والملف موجود بالفعل.
يرفع إذا كان dest ملفا مفتوحا وكان الملف غير قابل للكتابة.
set_data
set_data(*, training_data: Input, target_column_name: str, validation_data: Input) -> None
استثناءات
يرفع إذا كان dest هو مسار ملف والملف موجود بالفعل.
يرفع إذا كان dest ملفا مفتوحا وكان الملف غير قابل للكتابة.
set_featurization
set_featurization(*, dataset_language: str | None = None) -> None
استثناءات
يرفع إذا كان dest هو مسار ملف والملف موجود بالفعل.
يرفع إذا كان dest ملفا مفتوحا وكان الملف غير قابل للكتابة.
set_limits
set_limits(*, max_trials: int = 1, max_concurrent_trials: int = 1, max_nodes: int = 1, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None
استثناءات
يرفع إذا كان dest هو مسار ملف والملف موجود بالفعل.
يرفع إذا كان dest ملفا مفتوحا وكان الملف غير قابل للكتابة.
set_sweep
إعدادات المسح لجميع مهام AutoML NLP.
set_sweep(*, sampling_algorithm: str | SamplingAlgorithmType, early_termination: EarlyTerminationPolicy | None = None)
المعلمات
- sampling_algorithm
مطلوب يحدد نوع خوارزمية أخذ عينات المعلمات الفائقة. تتضمن القيم المحتملة: "Grid" و"Random" و"Bayesian".
- early_termination
نهج الإنهاء المبكر الاختياري لإنهاء المرشحين للتدريب الضعيف الأداء.
المرتجعات
بلا
استثناءات
يرفع إذا كان dest هو مسار ملف والملف موجود بالفعل.
يرفع إذا كان dest ملفا مفتوحا وكان الملف غير قابل للكتابة.
set_training_parameters
إصلاح معلمات تدريب معينة طوال إجراء التدريب لجميع المرشحين.
تمرير. يجب أن يكون هذا عددا صحيحا موجبا. :الكلمة الأساسية learning_rate: معدل التعلم الأولي. يجب أن يكون عائما في (0، 1). :الكلمة الأساسية learning_rate_scheduler: نوع مجدول معدل التعلم. يجب الاختيار من بين "خطي" و"جيب التمام" و"cosine_with_restarts" و"متعدد الحدود" و"ثابت" و"constant_with_warmup". :الكلمة الأساسية model_name: اسم النموذج المراد استخدامه أثناء التدريب. يجب أن تختار من بين "bert-base-cased"، "bert-base-uncased"، "bert-base-multilingual-cased"، "bert-base-german-cased"، "bert-large-cased"، 'bert-large-uncased', 'distilbert-base-cased', 'distilbert-base-uncased', 'roberta-base', 'roberta-large', 'distilroberta-base', 'xlm-roberta-base', 'xlm-roberta-large', xlnet-base-cased', و'xlnet-large-cased'. :الكلمة الأساسية number_of_epochs: عدد الفترات التي يجب التدريب بها. يجب أن تكون عدداً صحيحاً موجباً. :الكلمة الأساسية training_batch_size: حجم الدفعة أثناء التدريب. يجب أن تكون عدداً صحيحاً موجباً. :الكلمة الأساسية validation_batch_size: حجم الدفعة أثناء التحقق من الصحة. يجب أن تكون عدداً صحيحاً موجباً. :الكلمة الأساسية warmup_ratio: نسبة إجمالي خطوات التدريب المستخدمة لإعداد خطي من 0 إلى learning_rate. يجب أن يكون عائما في [0، 1]. :الكلمة الأساسية weight_decay: قيمة تسوس الوزن عندما يكون المحسن sgd أو adam أو adamw. يجب أن يكون هذا عائما في النطاق [0، 1]. :return: None.
set_training_parameters(*, gradient_accumulation_steps: int | None = None, learning_rate: float | None = None, learning_rate_scheduler: str | NlpLearningRateScheduler | None = None, model_name: str | None = None, number_of_epochs: int | None = None, training_batch_size: int | None = None, validation_batch_size: int | None = None, warmup_ratio: float | None = None, weight_decay: float | None = None) -> None
المعلمات
- gradient_accumulation_steps
عدد الخطوات التي يجب تجميع التدرجات فوقها قبل الرجوع إلى الخلف
استثناءات
يرفع إذا كان dest هو مسار ملف والملف موجود بالفعل.
يرفع إذا كان dest ملفا مفتوحا وكان الملف غير قابل للكتابة.
السمات
base_path
creation_context
featurization
id
معرف المورد.
المرتجعات
المعرف العمومي للمورد، معرف Azure Resource Manager (ARM).
نوع الإرجاع
inputs
limits
log_files
ملفات إخراج الوظيفة.
المرتجعات
قاموس أسماء السجلات وعناوين URL.
نوع الإرجاع
log_verbosity
outputs
primary_metric
search_space
status
حالة الوظيفة.
تتضمن القيم الشائعة التي تم إرجاعها "قيد التشغيل" و"مكتمل" و"فشل". جميع القيم المحتملة هي:
NotStarted - هذه حالة مؤقتة تكون فيها كائنات التشغيل من جانب العميل قبل إرسال السحابة.
البدء - بدأ التشغيل في المعالجة في السحابة. لدى المتصل معرف تشغيل في هذه المرحلة.
التوفير - يتم إنشاء حساب عند الطلب لتقديم وظيفة معينة.
التحضير - يتم إعداد بيئة التشغيل وهي في إحدى مرحلتين:
بناء صورة Docker
إعداد بيئة conda
في قائمة الانتظار - يتم وضع المهمة في قائمة الانتظار على هدف الحساب. على سبيل المثال، في BatchAI، تكون المهمة في حالة قائمة الانتظار
أثناء انتظار أن تكون جميع العقد المطلوبة جاهزة.
قيد التشغيل - بدأت المهمة في التشغيل على هدف الحساب.
إنهاء - اكتمل تنفيذ التعليمات البرمجية للمستخدم، والتشغيل في مراحل ما بعد المعالجة.
CancelRequested - تم طلب الإلغاء للوظيفة.
مكتمل - اكتمل التشغيل بنجاح. يتضمن ذلك كلا من تنفيذ التعليمات البرمجية للمستخدم وتشغيله
مراحل ما بعد المعالجة.
فشل - فشل التشغيل. عادة ما توفر الخاصية Error أثناء التشغيل تفاصيل حول السبب.
تم الإلغاء - يتبع طلب إلغاء ويشير إلى أن التشغيل قد تم إلغاؤه بنجاح الآن.
NotResponding - بالنسبة إلى عمليات التشغيل التي تم تمكين Heartbeats فيها، لم يتم إرسال رسالة كشف أخطاء الاتصال مؤخرا.
المرتجعات
حالة الوظيفة.
نوع الإرجاع
studio_url
نقطة نهاية استوديو التعلم الآلي من Microsoft Azure.
المرتجعات
عنوان URL لصفحة تفاصيل الوظيفة.
نوع الإرجاع
sweep
task_type
الحصول على نوع المهمة.
المرتجعات
نوع المهمة المراد تشغيلها. تتضمن القيم المحتملة: "التصنيف"، و"الانحدار"، و"التنبؤ".
نوع الإرجاع
test_data
training_data
training_parameters
type
validation_data
Azure SDK for Python
الملاحظات
https://aka.ms/ContentUserFeedback.
قريبًا: خلال عام 2024، سنتخلص تدريجيًا من GitHub Issues بوصفها آلية إرسال ملاحظات للمحتوى ونستبدلها بنظام ملاحظات جديد. لمزيد من المعلومات، راجعإرسال الملاحظات وعرضها المتعلقة بـ