Share via


TextClassificationJob Sınıf

AutoML Metin Sınıflandırma İşi yapılandırması.

Yeni bir AutoML Metin Sınıflandırması görevi başlatır.

Devralma
azure.ai.ml.entities._job.automl.nlp.automl_nlp_job.AutoMLNLPJob
TextClassificationJob

Oluşturucu

TextClassificationJob(*, target_column_name: str | None = None, training_data: Input | None = None, validation_data: Input | None = None, primary_metric: ClassificationPrimaryMetrics | None = None, log_verbosity: str | None = None, **kwargs)

Parametreler

target_column_name
Gerekli

Hedef sütunun adı

training_data
Gerekli

Eğitim için kullanılacak eğitim verileri

validation_data
Gerekli

Eğitilen modeli değerlendirmek için kullanılacak doğrulama verileri

primary_metric
Gerekli

Görüntülenecek birincil ölçüm

log_verbosity
Gerekli

Günlük ayrıntı düzeyi

kwargs
Gerekli

İşe özgü bağımsız değişkenler

Yöntemler

dump

İş içeriğini YAML biçiminde bir dosyaya dökümünü alır.

extend_search_space

(a) bu AutoML NLP işi için arama alanları ekleyin.

set_data
set_featurization
set_limits
set_sweep

Tüm AutoML NLP görevlerinin ayarlarını süpürme.

set_training_parameters

Tüm adaylar için eğitim yordamı boyunca belirli eğitim parametrelerini düzeltin.

Geçirmek. Bu pozitif bir tamsayı olmalıdır. :anahtar sözcük learning_rate: ilk öğrenme oranı. (0, 1) içinde bir float olmalıdır. :anahtar sözcük learning_rate_scheduler: Öğrenme hızı zamanlayıcısının türü. 'doğrusal', 'kosinüs', 'cosine_with_restarts', 'polinom', 'sabit' ve 'constant_with_warmup' arasından seçim yapmalıdır. :keyword model_name: eğitim sırasında kullanılacak model adı. 'bert-base-cased', 'bert-base-uncased', 'bert-base-multilingual-cased', 'bert-base-german-cased', 'bert-large-cased', 'bert-large-uncased', 'distilbert-base-cased', 'distilbert-base-uncased', 'roberta-base', 'roberta-large', 'distilroberta-base', 'xlm-roberta-base', 'xlm-roberta-large', xlnet-base-cased' ve 'xlnet-large-cased'. :anahtar sözcük number_of_epochs: eğitecek dönemlerin sayısı. Pozitif bir tamsayı olmalıdır. :anahtar sözcük training_batch_size: eğitim sırasında toplu iş boyutu. Pozitif bir tamsayı olmalıdır. :keyword validation_batch_size: doğrulama sırasında toplu iş boyutu. Pozitif bir tamsayı olmalıdır. :anahtar sözcük warmup_ratio: 0'dan learning_rate doğrusal ısınma için kullanılan toplam eğitim adımlarının oranı. [0, 1] içinde bir float olmalıdır. :keyword weight_decay: optimize edici sgd, adam veya adamw olduğunda ağırlık bozulma değeri. Bu, [0, 1] aralığındaki bir float olmalıdır. :return: Yok.

dump

İş içeriğini YAML biçiminde bir dosyaya dökümünü alır.

dump(dest: str | PathLike | IO, **kwargs) -> None

Parametreler

dest
Union[<xref:PathLike>, str, IO[AnyStr]]
Gerekli

YAML içeriğinin yazılabileceği yerel yol veya dosya akışı. Dest bir dosya yoluysa, yeni bir dosya oluşturulur. Dest açık bir dosyaysa, dosya doğrudan öğesine yazılır.

kwargs
dict

YAML seri hale getiricisine geçirecek ek bağımsız değişkenler.

Özel durumlar

dest bir dosya yoluysa ve dosya zaten varsa oluşturulur.

Dest açık bir dosyaysa ve dosya yazılabilir değilse oluşturulur.

extend_search_space

(a) bu AutoML NLP işi için arama alanları ekleyin.

extend_search_space(value: SearchSpace | List[SearchSpace]) -> None

Parametreler

value
Union[SearchSpace, List[SearchSpace]]
Gerekli

bir SearchSpace nesnesi veya nlp'ye özgü parametrelere sahip SearchSpace nesnelerinin listesi.

Döndürülenler

Yok.

Özel durumlar

dest bir dosya yoluysa ve dosya zaten varsa oluşturulur.

Dest açık bir dosyaysa ve dosya yazılabilir değilse oluşturulur.

set_data

set_data(*, training_data: Input, target_column_name: str, validation_data: Input) -> None

Özel durumlar

dest bir dosya yoluysa ve dosya zaten varsa oluşturulur.

Dest açık bir dosyaysa ve dosya yazılabilir değilse oluşturulur.

set_featurization

set_featurization(*, dataset_language: str | None = None) -> None

Özel durumlar

dest bir dosya yoluysa ve dosya zaten varsa oluşturulur.

Dest açık bir dosyaysa ve dosya yazılabilir değilse oluşturulur.

set_limits

set_limits(*, max_trials: int = 1, max_concurrent_trials: int = 1, max_nodes: int = 1, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None

Özel durumlar

dest bir dosya yoluysa ve dosya zaten varsa oluşturulur.

Dest açık bir dosyaysa ve dosya yazılabilir değilse oluşturulur.

set_sweep

Tüm AutoML NLP görevlerinin ayarlarını süpürme.

set_sweep(*, sampling_algorithm: str | SamplingAlgorithmType, early_termination: EarlyTerminationPolicy | None = None)

Parametreler

sampling_algorithm

Gereklidir. Hiper parametre örnekleme algoritmasının türünü belirtir. Olası değerler şunlardır: "Grid", "Random" ve "Bayesian".

early_termination

Kötü performans gösteren eğitim adaylarını sonlandırmak için isteğe bağlı erken sonlandırma ilkesi.

Döndürülenler

Hiçbiri

Özel durumlar

dest bir dosya yoluysa ve dosya zaten varsa oluşturulur.

Dest açık bir dosyaysa ve dosya yazılabilir değilse oluşturulur.

set_training_parameters

Tüm adaylar için eğitim yordamı boyunca belirli eğitim parametrelerini düzeltin.

Geçirmek. Bu pozitif bir tamsayı olmalıdır. :anahtar sözcük learning_rate: ilk öğrenme oranı. (0, 1) içinde bir float olmalıdır. :anahtar sözcük learning_rate_scheduler: Öğrenme hızı zamanlayıcısının türü. 'doğrusal', 'kosinüs', 'cosine_with_restarts', 'polinom', 'sabit' ve 'constant_with_warmup' arasından seçim yapmalıdır. :keyword model_name: eğitim sırasında kullanılacak model adı. 'bert-base-cased', 'bert-base-uncased', 'bert-base-multilingual-cased', 'bert-base-german-cased', 'bert-large-cased', 'bert-large-uncased', 'distilbert-base-cased', 'distilbert-base-uncased', 'roberta-base', 'roberta-large', 'distilroberta-base', 'xlm-roberta-base', 'xlm-roberta-large', xlnet-base-cased' ve 'xlnet-large-cased'. :anahtar sözcük number_of_epochs: eğitecek dönemlerin sayısı. Pozitif bir tamsayı olmalıdır. :anahtar sözcük training_batch_size: eğitim sırasında toplu iş boyutu. Pozitif bir tamsayı olmalıdır. :keyword validation_batch_size: doğrulama sırasında toplu iş boyutu. Pozitif bir tamsayı olmalıdır. :anahtar sözcük warmup_ratio: 0'dan learning_rate doğrusal ısınma için kullanılan toplam eğitim adımlarının oranı. [0, 1] içinde bir float olmalıdır. :keyword weight_decay: optimize edici sgd, adam veya adamw olduğunda ağırlık bozulma değeri. Bu, [0, 1] aralığındaki bir float olmalıdır. :return: Yok.

set_training_parameters(*, gradient_accumulation_steps: int | None = None, learning_rate: float | None = None, learning_rate_scheduler: str | NlpLearningRateScheduler | None = None, model_name: str | None = None, number_of_epochs: int | None = None, training_batch_size: int | None = None, validation_batch_size: int | None = None, warmup_ratio: float | None = None, weight_decay: float | None = None) -> None

Parametreler

gradient_accumulation_steps

geriye doğru gradyanların biriktirildiği adım sayısı

Özel durumlar

dest bir dosya yoluysa ve dosya zaten varsa oluşturulur.

Dest açık bir dosyaysa ve dosya yazılabilir değilse oluşturulur.

Öznitelikler

base_path

Kaynağın temel yolu.

Döndürülenler

Kaynağın temel yolu.

Dönüş türü

str

creation_context

Kaynağın oluşturma bağlamı.

Döndürülenler

Kaynağın oluşturma meta verileri.

Dönüş türü

featurization

id

Kaynak kimliği.

Döndürülenler

Kaynağın genel kimliği, azure Resource Manager (ARM) kimliği.

Dönüş türü

inputs

limits

log_files

İş çıktı dosyaları.

Döndürülenler

Günlük adlarının ve URL'lerin sözlüğü.

Dönüş türü

log_verbosity

outputs

primary_metric

search_space

status

İşin durumu.

Döndürülen yaygın değerler şunlardır: "Çalışıyor", "Tamamlandı" ve "Başarısız". Tüm olası değerler şunlardır:

  • NotStarted - Bu, istemci tarafı Run nesnelerinin bulut göndermeden önce içinde olduğu geçici bir durumdur.

  • Başlatılıyor - Çalıştırma bulutta işlenmeye başladı. Çağıranın bu noktada bir çalıştırma kimliği vardır.

  • Sağlama - Belirli bir iş gönderimi için isteğe bağlı işlem oluşturuluyor.

  • Hazırlanıyor - Çalıştırma ortamı hazırlanıyor ve iki aşamadan birinde:

    • Docker görüntü derlemesi

    • conda ortamı kurulumu

  • Kuyruğa alındı - İş, işlem hedefinde kuyruğa alınır. Örneğin BatchAI'de iş kuyruğa alınmış durumdadır

    tüm istenen düğümlerin hazır olmasını beklerken.

  • Çalışıyor - İş işlem hedefinde çalışmaya başladı.

  • Sonlandırma - Kullanıcı kodu yürütmesi tamamlandı ve çalıştırma işlem sonrası aşamalarda.

  • CancelRequested - İş için iptal istendi.

  • Tamamlandı - Çalıştırma başarıyla tamamlandı. Buna hem kullanıcı kodu yürütme hem de çalıştırma dahildir

    işlem sonrası aşamalar.

  • Başarısız - Çalıştırma başarısız oldu. Genellikle bir çalıştırmadaki Error özelliği nedenine ilişkin ayrıntıları sağlar.

  • İptal edildi - İptal isteğini izler ve çalıştırmanın artık başarıyla iptal edilmiş olduğunu gösterir.

  • NotResponding - Sinyallerin etkinleştirildiği çalıştırmalar için yakın zamanda sinyal gönderilmedi.

Döndürülenler

İşin durumu.

Dönüş türü

studio_url

Azure ML studio uç noktası.

Döndürülenler

İş ayrıntıları sayfasının URL'si.

Dönüş türü

sweep

task_type

Görev türünü alma.

Döndürülenler

Çalıştırılacak görevin türü. Olası değerler şunlardır: "sınıflandırma", "regresyon", "tahmin".

Dönüş türü

str

test_data

Test verilerini alın.

Döndürülenler

Veri girişini test edin

Dönüş türü

training_data

Eğitim verilerini alın.

Döndürülenler

Eğitim verileri girişi

Dönüş türü

training_parameters

type

İşin türü.

Döndürülenler

İşin türü.

Dönüş türü

validation_data

Doğrulama verilerini alma.

Döndürülenler

Doğrulama veri girişi

Dönüş türü