TextClassificationJob Sınıf

Başvuru

AutoML Metin Sınıflandırma İşi yapılandırması.

Yeni bir AutoML Metin Sınıflandırması görevi başlatır.

Devralma: azure.ai.ml.entities._job.automl.nlp.automl_nlp_job.AutoMLNLPJob

TextClassificationJob

Oluşturucu

TextClassificationJob(*, target_column_name: str | None = None, training_data: Input | None = None, validation_data: Input | None = None, primary_metric: ClassificationPrimaryMetrics | None = None, log_verbosity: str | None = None, **kwargs)

Parametreler

target_column_name

Gerekli

Hedef sütunun adı

training_data

Gerekli

Eğitim için kullanılacak eğitim verileri

validation_data

Gerekli

Eğitilen modeli değerlendirmek için kullanılacak doğrulama verileri

primary_metric

Gerekli

Görüntülenecek birincil ölçüm

log_verbosity

Gerekli

Günlük ayrıntı düzeyi

kwargs

Gerekli

İşe özgü bağımsız değişkenler

Yöntemler

dump	İş içeriğini YAML biçiminde bir dosyaya dökümünü alır.
extend_search_space	(a) bu AutoML NLP işi için arama alanları ekleyin.
set_data
set_featurization
set_limits
set_sweep	Tüm AutoML NLP görevlerinin ayarlarını süpürme.
set_training_parameters	Tüm adaylar için eğitim yordamı boyunca belirli eğitim parametrelerini düzeltin. Geçirmek. Bu pozitif bir tamsayı olmalıdır. :anahtar sözcük learning_rate: ilk öğrenme oranı. (0, 1) içinde bir float olmalıdır. :anahtar sözcük learning_rate_scheduler: Öğrenme hızı zamanlayıcısının türü. 'doğrusal', 'kosinüs', 'cosine_with_restarts', 'polinom', 'sabit' ve 'constant_with_warmup' arasından seçim yapmalıdır. :keyword model_name: eğitim sırasında kullanılacak model adı. 'bert-base-cased', 'bert-base-uncased', 'bert-base-multilingual-cased', 'bert-base-german-cased', 'bert-large-cased', 'bert-large-uncased', 'distilbert-base-cased', 'distilbert-base-uncased', 'roberta-base', 'roberta-large', 'distilroberta-base', 'xlm-roberta-base', 'xlm-roberta-large', xlnet-base-cased' ve 'xlnet-large-cased'. :anahtar sözcük number_of_epochs: eğitecek dönemlerin sayısı. Pozitif bir tamsayı olmalıdır. :anahtar sözcük training_batch_size: eğitim sırasında toplu iş boyutu. Pozitif bir tamsayı olmalıdır. :keyword validation_batch_size: doğrulama sırasında toplu iş boyutu. Pozitif bir tamsayı olmalıdır. :anahtar sözcük warmup_ratio: 0'dan learning_rate doğrusal ısınma için kullanılan toplam eğitim adımlarının oranı. [0, 1] içinde bir float olmalıdır. :keyword weight_decay: optimize edici sgd, adam veya adamw olduğunda ağırlık bozulma değeri. Bu, [0, 1] aralığındaki bir float olmalıdır. :return: Yok.

dump

İş içeriğini YAML biçiminde bir dosyaya dökümünü alır.

dump(dest: str | PathLike | IO, **kwargs) -> None

Parametreler

dest: Union[<xref:PathLike>, str, IO[AnyStr]]

Gerekli

YAML içeriğinin yazılabileceği yerel yol veya dosya akışı. Dest bir dosya yoluysa, yeni bir dosya oluşturulur. Dest açık bir dosyaysa, dosya doğrudan öğesine yazılır.

kwargs: dict

YAML seri hale getiricisine geçirecek ek bağımsız değişkenler.

Özel durumlar

FileExistsError

dest bir dosya yoluysa ve dosya zaten varsa oluşturulur.

IOError

Dest açık bir dosyaysa ve dosya yazılabilir değilse oluşturulur.

extend_search_space

(a) bu AutoML NLP işi için arama alanları ekleyin.

extend_search_space(value: SearchSpace | List[SearchSpace]) -> None

Parametreler

value: Union[SearchSpace, List[SearchSpace]]

Gerekli

bir SearchSpace nesnesi veya nlp'ye özgü parametrelere sahip SearchSpace nesnelerinin listesi.

Döndürülenler

Yok.

Özel durumlar

FileExistsError

dest bir dosya yoluysa ve dosya zaten varsa oluşturulur.

IOError

Dest açık bir dosyaysa ve dosya yazılabilir değilse oluşturulur.

set_data

set_data(*, training_data: Input, target_column_name: str, validation_data: Input) -> None

Özel durumlar

FileExistsError

dest bir dosya yoluysa ve dosya zaten varsa oluşturulur.

IOError

Dest açık bir dosyaysa ve dosya yazılabilir değilse oluşturulur.

set_featurization

set_featurization(*, dataset_language: str | None = None) -> None

Özel durumlar

FileExistsError

dest bir dosya yoluysa ve dosya zaten varsa oluşturulur.

IOError

Dest açık bir dosyaysa ve dosya yazılabilir değilse oluşturulur.

set_limits

set_limits(*, max_trials: int = 1, max_concurrent_trials: int = 1, max_nodes: int = 1, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None

Özel durumlar

FileExistsError

dest bir dosya yoluysa ve dosya zaten varsa oluşturulur.

IOError

Dest açık bir dosyaysa ve dosya yazılabilir değilse oluşturulur.

set_sweep

Tüm AutoML NLP görevlerinin ayarlarını süpürme.

set_sweep(*, sampling_algorithm: str | SamplingAlgorithmType, early_termination: EarlyTerminationPolicy | None = None)

Parametreler

sampling_algorithm

Gereklidir. Hiper parametre örnekleme algoritmasının türünü belirtir. Olası değerler şunlardır: "Grid", "Random" ve "Bayesian".

early_termination

Kötü performans gösteren eğitim adaylarını sonlandırmak için isteğe bağlı erken sonlandırma ilkesi.

Döndürülenler

Hiçbiri

Özel durumlar

FileExistsError

dest bir dosya yoluysa ve dosya zaten varsa oluşturulur.

IOError

Dest açık bir dosyaysa ve dosya yazılabilir değilse oluşturulur.

set_training_parameters

Tüm adaylar için eğitim yordamı boyunca belirli eğitim parametrelerini düzeltin.

Geçirmek. Bu pozitif bir tamsayı olmalıdır. :anahtar sözcük learning_rate: ilk öğrenme oranı. (0, 1) içinde bir float olmalıdır. :anahtar sözcük learning_rate_scheduler: Öğrenme hızı zamanlayıcısının türü. 'doğrusal', 'kosinüs', 'cosine_with_restarts', 'polinom', 'sabit' ve 'constant_with_warmup' arasından seçim yapmalıdır. :keyword model_name: eğitim sırasında kullanılacak model adı. 'bert-base-cased', 'bert-base-uncased', 'bert-base-multilingual-cased', 'bert-base-german-cased', 'bert-large-cased', 'bert-large-uncased', 'distilbert-base-cased', 'distilbert-base-uncased', 'roberta-base', 'roberta-large', 'distilroberta-base', 'xlm-roberta-base', 'xlm-roberta-large', xlnet-base-cased' ve 'xlnet-large-cased'. :anahtar sözcük number_of_epochs: eğitecek dönemlerin sayısı. Pozitif bir tamsayı olmalıdır. :anahtar sözcük training_batch_size: eğitim sırasında toplu iş boyutu. Pozitif bir tamsayı olmalıdır. :keyword validation_batch_size: doğrulama sırasında toplu iş boyutu. Pozitif bir tamsayı olmalıdır. :anahtar sözcük warmup_ratio: 0'dan learning_rate doğrusal ısınma için kullanılan toplam eğitim adımlarının oranı. [0, 1] içinde bir float olmalıdır. :keyword weight_decay: optimize edici sgd, adam veya adamw olduğunda ağırlık bozulma değeri. Bu, [0, 1] aralığındaki bir float olmalıdır. :return: Yok.

set_training_parameters(*, gradient_accumulation_steps: int | None = None, learning_rate: float | None = None, learning_rate_scheduler: str | NlpLearningRateScheduler | None = None, model_name: str | None = None, number_of_epochs: int | None = None, training_batch_size: int | None = None, validation_batch_size: int | None = None, warmup_ratio: float | None = None, weight_decay: float | None = None) -> None

Parametreler

gradient_accumulation_steps

geriye doğru gradyanların biriktirildiği adım sayısı

Özel durumlar

FileExistsError

dest bir dosya yoluysa ve dosya zaten varsa oluşturulur.

IOError

Dest açık bir dosyaysa ve dosya yazılabilir değilse oluşturulur.

Öznitelikler

base_path

Kaynağın temel yolu.

Döndürülenler

Kaynağın temel yolu.

Dönüş türü

str

creation_context

Kaynağın oluşturma bağlamı.

Döndürülenler

Kaynağın oluşturma meta verileri.

Dönüş türü

Optional[SystemData]

featurization

id

Kaynak kimliği.

Döndürülenler

Kaynağın genel kimliği, azure Resource Manager (ARM) kimliği.

Dönüş türü

Optional[str]

inputs

limits

log_files

İş çıktı dosyaları.

Döndürülenler

Günlük adlarının ve URL'lerin sözlüğü.

Dönüş türü

Optional[Dict[str, str]]

log_verbosity

outputs

primary_metric

search_space

status

İşin durumu.

Döndürülen yaygın değerler şunlardır: "Çalışıyor", "Tamamlandı" ve "Başarısız". Tüm olası değerler şunlardır:

NotStarted - Bu, istemci tarafı Run nesnelerinin bulut göndermeden önce içinde olduğu geçici bir durumdur.
Başlatılıyor - Çalıştırma bulutta işlenmeye başladı. Çağıranın bu noktada bir çalıştırma kimliği vardır.
Sağlama - Belirli bir iş gönderimi için isteğe bağlı işlem oluşturuluyor.
Hazırlanıyor - Çalıştırma ortamı hazırlanıyor ve iki aşamadan birinde:
- Docker görüntü derlemesi
- conda ortamı kurulumu
Kuyruğa alındı - İş, işlem hedefinde kuyruğa alınır. Örneğin BatchAI'de iş kuyruğa alınmış durumdadır

tüm istenen düğümlerin hazır olmasını beklerken.
Çalışıyor - İş işlem hedefinde çalışmaya başladı.
Sonlandırma - Kullanıcı kodu yürütmesi tamamlandı ve çalıştırma işlem sonrası aşamalarda.
CancelRequested - İş için iptal istendi.
Tamamlandı - Çalıştırma başarıyla tamamlandı. Buna hem kullanıcı kodu yürütme hem de çalıştırma dahildir

işlem sonrası aşamalar.
Başarısız - Çalıştırma başarısız oldu. Genellikle bir çalıştırmadaki Error özelliği nedenine ilişkin ayrıntıları sağlar.
İptal edildi - İptal isteğini izler ve çalıştırmanın artık başarıyla iptal edilmiş olduğunu gösterir.
NotResponding - Sinyallerin etkinleştirildiği çalıştırmalar için yakın zamanda sinyal gönderilmedi.

Döndürülenler

İşin durumu.

Dönüş türü

Optional[str]

studio_url

Azure ML studio uç noktası.

Döndürülenler

İş ayrıntıları sayfasının URL'si.

Dönüş türü

Optional[str]

sweep

task_type

Görev türünü alma.

Döndürülenler

Çalıştırılacak görevin türü. Olası değerler şunlardır: "sınıflandırma", "regresyon", "tahmin".

Dönüş türü

str

test_data

Test verilerini alın.

Döndürülenler

Veri girişini test edin

Dönüş türü

Input

training_data

Eğitim verilerini alın.

Döndürülenler

Eğitim verileri girişi

Dönüş türü

Input

training_parameters

type

İşin türü.

Döndürülenler

İşin türü.

Dönüş türü

Optional[str]

validation_data

Doğrulama verilerini alma.

Döndürülenler

Doğrulama veri girişi

Dönüş türü

Input

Aracılığıyla paylaş

TextClassificationJob Sınıf

Oluşturucu

Parametreler

Yöntemler

dump

Parametreler

Özel durumlar

extend_search_space

Parametreler

Döndürülenler

Özel durumlar

set_data

Özel durumlar

set_featurization

Özel durumlar

set_limits

Özel durumlar

set_sweep

Parametreler

Döndürülenler

Özel durumlar

set_training_parameters

Parametreler

Özel durumlar

Öznitelikler

base_path

Döndürülenler

Dönüş türü

creation_context

Döndürülenler

Dönüş türü

featurization

id

Döndürülenler

Dönüş türü

inputs

limits

log_files

Döndürülenler

Dönüş türü

log_verbosity

outputs

primary_metric

search_space

status

Döndürülenler

Dönüş türü

studio_url

Döndürülenler

Dönüş türü

sweep

task_type

Döndürülenler

Dönüş türü

test_data

Döndürülenler

Dönüş türü

training_data

Döndürülenler

Dönüş türü

training_parameters

type

Döndürülenler

Dönüş türü

validation_data

Döndürülenler

Dönüş türü

Ek kaynaklar