Share via


TextNerJob Sınıf

AutoML Metin NER İşi yapılandırması.

Yeni bir AutoML Metin NER görevi başlatır.

Devralma
azure.ai.ml.entities._job.automl.nlp.automl_nlp_job.AutoMLNLPJob
TextNerJob

Oluşturucu

TextNerJob(*, training_data: Input | None = None, validation_data: Input | None = None, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs)

Parametreler

training_data
Gerekli

Eğitim için kullanılacak eğitim verileri

validation_data
Gerekli

Eğitilen modeli değerlendirmek için kullanılacak doğrulama verileri

primary_metric
Gerekli

Görüntülenecek birincil ölçüm.

log_verbosity
Gerekli

Günlük ayrıntı düzeyi

kwargs
Gerekli

İşe özgü bağımsız değişkenler

Yöntemler

dump

İş içeriğini YAML biçiminde bir dosyaya dökümünü alır.

extend_search_space

(a) bu AutoML NLP işi için arama alanları ekleyin.

set_data
set_featurization
set_limits
set_sweep

Tüm AutoML NLP görevleri için süpürme ayarları.

set_training_parameters

Tüm adaylar için eğitim yordamı boyunca belirli eğitim parametrelerini düzeltin.

Geçirmek. Bu pozitif bir tamsayı olmalıdır. :anahtar sözcük learning_rate: ilk öğrenme oranı. içinde bir float olmalıdır (0, 1). :anahtar sözcük learning_rate_scheduler: öğrenme oranı zamanlayıcısının türü. 'doğrusal', 'kosinüs', 'cosine_with_restarts', 'polinom', 'sabit' ve 'constant_with_warmup' arasından seçim yapmalıdır. :anahtar sözcük model_name: eğitim sırasında kullanılacak model adı. 'bert-base-cased', 'bert-base-uncased', 'bert-base-multilingual-cased', 'bert-base-german-cased', 'bert-large-cased', 'bert-large-uncased', 'distilbert-base-cased', 'distilbert-base-uncased', 'roberta-base', 'roberta-large', 'distilroberta-base', 'xlm-roberta-base', 'xlm-roberta-large', xlnet-base-cased' ve 'xlnet-large-cased'. :anahtar sözcük number_of_epochs: eğitecek dönemlerin sayısı. Pozitif bir tamsayı olmalıdır. :anahtar sözcük training_batch_size: eğitim sırasında toplu iş boyutu. Pozitif bir tamsayı olmalıdır. :anahtar sözcük validation_batch_size: doğrulama sırasında toplu iş boyutu. Pozitif bir tamsayı olmalıdır. :anahtar sözcük warmup_ratio: 0'dan learning_rate doğrusal ısınma için kullanılan toplam eğitim adımlarının oranı. [0, 1] içinde bir float olmalıdır. :anahtar sözcük weight_decay: iyileştirici sgd, adam veya adamw olduğunda ağırlık bozulmasının değeri. Bu, [0, 1] aralığındaki bir float olmalıdır. :return: Yok.

dump

İş içeriğini YAML biçiminde bir dosyaya dökümünü alır.

dump(dest: str | PathLike | IO, **kwargs) -> None

Parametreler

dest
Union[<xref:PathLike>, str, IO[AnyStr]]
Gerekli

YAML içeriğinin yazılabileceği yerel yol veya dosya akışı. Dest bir dosya yoluysa yeni bir dosya oluşturulur. Dest açık bir dosyaysa, dosya doğrudan öğesine yazılır.

kwargs
dict

YAML seri hale getiricisine geçirmek için ek bağımsız değişkenler.

Özel durumlar

Dest bir dosya yoluysa ve dosya zaten varsa oluşturulur.

Dest açık bir dosyaysa ve dosya yazılabilir değilse oluşturulur.

extend_search_space

(a) bu AutoML NLP işi için arama alanları ekleyin.

extend_search_space(value: SearchSpace | List[SearchSpace]) -> None

Parametreler

value
Union[SearchSpace, List[SearchSpace]]
Gerekli

bir SearchSpace nesnesi veya nlp'ye özgü parametrelere sahip SearchSpace nesnelerinin listesi.

Döndürülenler

Yok.

Özel durumlar

Dest bir dosya yoluysa ve dosya zaten varsa oluşturulur.

Dest açık bir dosyaysa ve dosya yazılabilir değilse oluşturulur.

set_data

set_data(*, training_data: Input, target_column_name: str, validation_data: Input) -> None

Özel durumlar

Dest bir dosya yoluysa ve dosya zaten varsa oluşturulur.

Dest açık bir dosyaysa ve dosya yazılabilir değilse oluşturulur.

set_featurization

set_featurization(*, dataset_language: str | None = None) -> None

Özel durumlar

Dest bir dosya yoluysa ve dosya zaten varsa oluşturulur.

Dest açık bir dosyaysa ve dosya yazılabilir değilse oluşturulur.

set_limits

set_limits(*, max_trials: int = 1, max_concurrent_trials: int = 1, max_nodes: int = 1, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None

Özel durumlar

Dest bir dosya yoluysa ve dosya zaten varsa oluşturulur.

Dest açık bir dosyaysa ve dosya yazılabilir değilse oluşturulur.

set_sweep

Tüm AutoML NLP görevleri için süpürme ayarları.

set_sweep(*, sampling_algorithm: str | SamplingAlgorithmType, early_termination: EarlyTerminationPolicy | None = None)

Parametreler

sampling_algorithm

Gereklidir. Hiper parametre örnekleme algoritmasının türünü belirtir. Olası değerler şunlardır: "Grid", "Random" ve "Bayesian".

early_termination

Kötü performans gösteren eğitim adaylarını sonlandırmak için isteğe bağlı erken sonlandırma ilkesi.

Döndürülenler

Hiçbiri

Özel durumlar

Dest bir dosya yoluysa ve dosya zaten varsa oluşturulur.

Dest açık bir dosyaysa ve dosya yazılabilir değilse oluşturulur.

set_training_parameters

Tüm adaylar için eğitim yordamı boyunca belirli eğitim parametrelerini düzeltin.

Geçirmek. Bu pozitif bir tamsayı olmalıdır. :anahtar sözcük learning_rate: ilk öğrenme oranı. içinde bir float olmalıdır (0, 1). :anahtar sözcük learning_rate_scheduler: öğrenme oranı zamanlayıcısının türü. 'doğrusal', 'kosinüs', 'cosine_with_restarts', 'polinom', 'sabit' ve 'constant_with_warmup' arasından seçim yapmalıdır. :anahtar sözcük model_name: eğitim sırasında kullanılacak model adı. 'bert-base-cased', 'bert-base-uncased', 'bert-base-multilingual-cased', 'bert-base-german-cased', 'bert-large-cased', 'bert-large-uncased', 'distilbert-base-cased', 'distilbert-base-uncased', 'roberta-base', 'roberta-large', 'distilroberta-base', 'xlm-roberta-base', 'xlm-roberta-large', xlnet-base-cased' ve 'xlnet-large-cased'. :anahtar sözcük number_of_epochs: eğitecek dönemlerin sayısı. Pozitif bir tamsayı olmalıdır. :anahtar sözcük training_batch_size: eğitim sırasında toplu iş boyutu. Pozitif bir tamsayı olmalıdır. :anahtar sözcük validation_batch_size: doğrulama sırasında toplu iş boyutu. Pozitif bir tamsayı olmalıdır. :anahtar sözcük warmup_ratio: 0'dan learning_rate doğrusal ısınma için kullanılan toplam eğitim adımlarının oranı. [0, 1] içinde bir float olmalıdır. :anahtar sözcük weight_decay: iyileştirici sgd, adam veya adamw olduğunda ağırlık bozulmasının değeri. Bu, [0, 1] aralığındaki bir float olmalıdır. :return: Yok.

set_training_parameters(*, gradient_accumulation_steps: int | None = None, learning_rate: float | None = None, learning_rate_scheduler: str | NlpLearningRateScheduler | None = None, model_name: str | None = None, number_of_epochs: int | None = None, training_batch_size: int | None = None, validation_batch_size: int | None = None, warmup_ratio: float | None = None, weight_decay: float | None = None) -> None

Parametreler

gradient_accumulation_steps

geriden önce gradyanların biriktirildiği adım sayısı

Özel durumlar

Dest bir dosya yoluysa ve dosya zaten varsa oluşturulur.

Dest açık bir dosyaysa ve dosya yazılabilir değilse oluşturulur.

Öznitelikler

base_path

Kaynağın temel yolu.

Döndürülenler

Kaynağın temel yolu.

Dönüş türü

str

creation_context

Kaynağın oluşturma bağlamı.

Döndürülenler

Kaynağın oluşturma meta verileri.

Dönüş türü

featurization

id

Kaynak kimliği.

Döndürülenler

Kaynağın genel kimliği, Azure Resource Manager (ARM) kimliği.

Dönüş türü

inputs

limits

log_files

İş çıkış dosyaları.

Döndürülenler

Günlük adlarının ve URL'lerin sözlüğü.

Dönüş türü

log_verbosity

outputs

primary_metric

search_space

status

İşin durumu.

Döndürülen yaygın değerler şunlardır: "Çalışıyor", "Tamamlandı" ve "Başarısız". Tüm olası değerler şunlardır:

  • NotStarted - Bu, istemci tarafı Çalıştırma nesnelerinin bulut göndermeden önce içinde olduğu geçici bir durumdur.

  • Başlatılıyor - Çalıştırma bulutta işlenmeye başladı. Çağıranın bu noktada bir çalıştırma kimliği vardır.

  • Sağlama - Belirli bir iş gönderimi için isteğe bağlı işlem oluşturuluyor.

  • Hazırlanıyor - Çalıştırma ortamı hazırlanıyor ve iki aşamadan birinde:

    • Docker görüntü derlemesi

    • conda ortamı kurulumu

  • Kuyruğa alındı - İş işlem hedefinde kuyruğa alındı. Örneğin, BatchAI'de iş kuyruğa alınmış durumdadır

    tüm istenen düğümlerin hazır olmasını beklerken.

  • Çalışıyor - İş işlem hedefinde çalışmaya başladı.

  • Son haline getirme - Kullanıcı kodu yürütmesi tamamlandı ve çalıştırma işlem sonrası aşamalarda.

  • CancelRequested - İş için iptal istendi.

  • Tamamlandı - Çalıştırma başarıyla tamamlandı. Buna hem kullanıcı kodu yürütme hem de çalıştırma dahildir

    işlem sonrası aşamalar.

  • Başarısız - Çalıştırma başarısız oldu. Genellikle bir çalıştırmadaki Error özelliği nedenine ilişkin ayrıntıları sağlar.

  • İptal edildi - bir iptal isteği izler ve çalıştırmanın başarıyla iptal edildi olduğunu gösterir.

  • NotResponding - Sinyallerin etkinleştirildiği çalıştırmalar için yakın zamanda sinyal gönderilmedi.

Döndürülenler

İşin durumu.

Dönüş türü

studio_url

Azure ML studio uç noktası.

Döndürülenler

İş ayrıntıları sayfasının URL'si.

Dönüş türü

sweep

task_type

Görev türünü alma.

Döndürülenler

Çalıştırılacak görevin türü. Olası değerler şunlardır: "sınıflandırma", "regresyon", "tahmin".

Dönüş türü

str

test_data

Test verilerini alın.

Döndürülenler

Veri girişini test etme

Dönüş türü

training_data

Eğitim verilerini alın.

Döndürülenler

Eğitim verileri girişi

Dönüş türü

training_parameters

type

İşin türü.

Döndürülenler

İşin türü.

Dönüş türü

validation_data

Doğrulama verilerini alma.

Döndürülenler

Doğrulama veri girişi

Dönüş türü