Udostępnij za pośrednictwem


TextClassificationMultilabelJob Klasa

Konfiguracja zadania wieloznakowego klasyfikacji tekstu autoML.

Inicjuje nowe zadanie multilabel klasyfikacji tekstu automatycznego uczenia maszynowego.

Dziedziczenie
azure.ai.ml.entities._job.automl.nlp.automl_nlp_job.AutoMLNLPJob
TextClassificationMultilabelJob

Konstruktor

TextClassificationMultilabelJob(*, target_column_name: str | None = None, training_data: Input | None = None, validation_data: Input | None = None, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs)

Parametry

target_column_name
Wymagane

Nazwa kolumny docelowej

training_data
Wymagane

Dane szkoleniowe, które mają być używane do trenowania

validation_data
Wymagane

Dane weryfikacji, które mają być używane do oceny wytrenowanego modelu

primary_metric
Wymagane

Wyświetlana jest podstawowa metryka.

log_verbosity
Wymagane

Poziom szczegółowości dziennika

kwargs
Wymagane

Argumenty specyficzne dla zadania

Metody

dump

Zrzuty zawartości zadania do pliku w formacie YAML.

extend_search_space

Dodaj (a) spacje wyszukiwania dla tego zadania nlP rozwiązania AutoML.

set_data
set_featurization
set_limits
set_sweep

Zamiatanie ustawień dla wszystkich zadań równoważenia obciążenia sieciowego automatycznego uczenia maszynowego.

set_training_parameters

Napraw niektóre parametry treningowe w całej procedurze szkoleniowej dla wszystkich kandydatów.

Przekazać. Musi to być dodatnia liczba całkowita. :słowo kluczowe learning_rate: początkowa szybkość nauki. Musi być zmiennoprzecinkowym (0, 1). :słowo kluczowe learning_rate_scheduler: typ harmonogramu szybkości nauki. Należy wybrać jedną z opcji "liniowych", "cosinus", "cosine_with_restarts", "wielomianu", "stałej" i "constant_with_warmup". :słowo kluczowe model_name: nazwa modelu do użycia podczas trenowania. Musi wybrać "bert-base-cased", "bert-base-uncased", "bert-base-multilingual-cased", "bert-base-german-cased", "bert-large-cased", "bert-large-uncased", "distilbert-base-cased", "distilbert-base-uncased", "roberta-base", "roberta-large", "distilroberta-base", "xlm-roberta-base", "xlm-roberta-large", xlnet-base-cased" i "xlnet-large-cased". :słowo kluczowe number_of_epochs: liczba epok do trenowania. Musi być dodatnią liczbą całkowitą. :słowo kluczowe training_batch_size: rozmiar partii podczas trenowania. Musi być dodatnią liczbą całkowitą. :słowo kluczowe validation_batch_size: rozmiar partii podczas walidacji. Musi być dodatnią liczbą całkowitą. :słowo kluczowe warmup_ratio: stosunek łącznych kroków treningowych używanych do rozgrzewki liniowej z zakresu od 0 do learning_rate. Musi być zmiennoprzecinkowym w [0, 1]. :słowo kluczowe weight_decay: wartość rozpadu wagi, gdy optymalizator jest sgd, adam lub adamw. Musi to być zmiennoprzecinkowy w zakresie [0, 1]. :return: Brak.

dump

Zrzuty zawartości zadania do pliku w formacie YAML.

dump(dest: str | PathLike | IO, **kwargs) -> None

Parametry

dest
Union[<xref:PathLike>, str, IO[AnyStr]]
Wymagane

Ścieżka lokalna lub strumień plików do zapisania zawartości YAML do. Jeśli dest jest ścieżką pliku, zostanie utworzony nowy plik. Jeśli dest jest otwartym plikiem, plik zostanie zapisany bezpośrednio.

kwargs
dict

Dodatkowe argumenty do przekazania do serializatora YAML.

Wyjątki

Podniesione, jeśli dest jest ścieżką pliku i plik już istnieje.

Podniesione, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.

extend_search_space

Dodaj (a) spacje wyszukiwania dla tego zadania nlP rozwiązania AutoML.

extend_search_space(value: SearchSpace | List[SearchSpace]) -> None

Parametry

value
Union[SearchSpace, List[SearchSpace]]
Wymagane

obiekt SearchSpace lub lista obiektów SearchSpace z parametrami specyficznymi dla nlp.

Zwraca

Brak.

Wyjątki

Podniesione, jeśli dest jest ścieżką pliku i plik już istnieje.

Podniesione, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.

set_data

set_data(*, training_data: Input, target_column_name: str, validation_data: Input) -> None

Wyjątki

Podniesione, jeśli dest jest ścieżką pliku i plik już istnieje.

Podniesione, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.

set_featurization

set_featurization(*, dataset_language: str | None = None) -> None

Wyjątki

Podniesione, jeśli dest jest ścieżką pliku i plik już istnieje.

Podniesione, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.

set_limits

set_limits(*, max_trials: int = 1, max_concurrent_trials: int = 1, max_nodes: int = 1, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None

Wyjątki

Podniesione, jeśli dest jest ścieżką pliku i plik już istnieje.

Podniesione, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.

set_sweep

Zamiatanie ustawień dla wszystkich zadań równoważenia obciążenia sieciowego automatycznego uczenia maszynowego.

set_sweep(*, sampling_algorithm: str | SamplingAlgorithmType, early_termination: EarlyTerminationPolicy | None = None)

Parametry

sampling_algorithm

Wymagane. Określa typ algorytmu próbkowania hiperparametrów. Możliwe wartości to: "Grid", "Random" i "Bayesian".

early_termination

Opcjonalne zasady wczesnego zakończenia, aby zakończyć słabe wyniki szkolenia kandydatów.

Zwraca

Brak

Wyjątki

Podniesione, jeśli dest jest ścieżką pliku i plik już istnieje.

Podniesione, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.

set_training_parameters

Napraw niektóre parametry treningowe w całej procedurze szkoleniowej dla wszystkich kandydatów.

Przekazać. Musi to być dodatnia liczba całkowita. :słowo kluczowe learning_rate: początkowa szybkość nauki. Musi być zmiennoprzecinkowym (0, 1). :słowo kluczowe learning_rate_scheduler: typ harmonogramu szybkości nauki. Należy wybrać jedną z opcji "liniowych", "cosinus", "cosine_with_restarts", "wielomianu", "stałej" i "constant_with_warmup". :słowo kluczowe model_name: nazwa modelu do użycia podczas trenowania. Musi wybrać "bert-base-cased", "bert-base-uncased", "bert-base-multilingual-cased", "bert-base-german-cased", "bert-large-cased", "bert-large-uncased", "distilbert-base-cased", "distilbert-base-uncased", "roberta-base", "roberta-large", "distilroberta-base", "xlm-roberta-base", "xlm-roberta-large", xlnet-base-cased" i "xlnet-large-cased". :słowo kluczowe number_of_epochs: liczba epok do trenowania. Musi być dodatnią liczbą całkowitą. :słowo kluczowe training_batch_size: rozmiar partii podczas trenowania. Musi być dodatnią liczbą całkowitą. :słowo kluczowe validation_batch_size: rozmiar partii podczas walidacji. Musi być dodatnią liczbą całkowitą. :słowo kluczowe warmup_ratio: stosunek łącznych kroków treningowych używanych do rozgrzewki liniowej z zakresu od 0 do learning_rate. Musi być zmiennoprzecinkowym w [0, 1]. :słowo kluczowe weight_decay: wartość rozpadu wagi, gdy optymalizator jest sgd, adam lub adamw. Musi to być zmiennoprzecinkowy w zakresie [0, 1]. :return: Brak.

set_training_parameters(*, gradient_accumulation_steps: int | None = None, learning_rate: float | None = None, learning_rate_scheduler: str | NlpLearningRateScheduler | None = None, model_name: str | None = None, number_of_epochs: int | None = None, training_batch_size: int | None = None, validation_batch_size: int | None = None, warmup_ratio: float | None = None, weight_decay: float | None = None) -> None

Parametry

gradient_accumulation_steps

liczba kroków, na które mają być skumulowane gradienty przed tyłem

Wyjątki

Podniesione, jeśli dest jest ścieżką pliku i plik już istnieje.

Podniesione, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.

Atrybuty

base_path

Podstawowa ścieżka zasobu.

Zwraca

Podstawowa ścieżka zasobu.

Typ zwracany

str

creation_context

Kontekst tworzenia zasobu.

Zwraca

Metadane tworzenia zasobu.

Typ zwracany

featurization

id

Identyfikator zasobu.

Zwraca

Globalny identyfikator zasobu, identyfikator usługi Azure Resource Manager (ARM).

Typ zwracany

inputs

limits

log_files

Pliki wyjściowe zadania.

Zwraca

Słownik nazw dzienników i adresów URL.

Typ zwracany

log_verbosity

outputs

primary_metric

search_space

status

Stan zadania.

Zwracane wspólne wartości to "Running", "Completed" i "Failed". Wszystkie możliwe wartości to:

  • NotStarted — jest to stan tymczasowy, w przypadku którego przed przesłaniem chmury znajdują się obiekty Uruchom po stronie klienta.

  • Uruchamianie — uruchamianie zaczęło być przetwarzane w chmurze. Obiekt wywołujący ma w tym momencie identyfikator uruchomienia.

  • Aprowizowanie — zasoby obliczeniowe na żądanie są tworzone dla danego przesłania zadania.

  • Przygotowywanie — środowisko uruchamiania jest przygotowane i znajduje się w jednym z dwóch etapów:

    • Kompilacja obrazu platformy Docker

    • Konfiguracja środowiska conda

  • Queued — zadanie jest w kolejce w obiekcie docelowym obliczeniowym. Na przykład w usłudze BatchAI zadanie jest w stanie w kolejce

    czekając na gotowość wszystkich żądanych węzłów.

  • Uruchomiono — zadanie zostało uruchomione na docelowym obiekcie obliczeniowym.

  • Finalizowanie — wykonanie kodu użytkownika zostało ukończone, a przebieg znajduje się na etapach przetwarzania końcowego.

  • CancelRequested — zażądano anulowania zadania.

  • Ukończono — przebieg został ukończony pomyślnie. Obejmuje to zarówno wykonywanie kodu użytkownika, jak i uruchamianie

    etapy przetwarzania końcowego.

  • Niepowodzenie — przebieg zakończył się niepowodzeniem. Zazwyczaj właściwość Error w przebiegu zawiera szczegółowe informacje o przyczynie.

  • Anulowano — następuje żądanie anulowania i wskazuje, że przebieg został pomyślnie anulowany.

  • Brak odpowiedzi — w przypadku przebiegów z włączonymi pulsami nie wysłano ostatnio żadnego pulsu.

Zwraca

Stan zadania.

Typ zwracany

studio_url

Punkt końcowy usługi Azure ML Studio.

Zwraca

Adres URL strony szczegółów zadania.

Typ zwracany

sweep

task_type

Pobierz typ zadania.

Zwraca

Typ zadania do uruchomienia. Możliwe wartości to: "classification", "regression", "forecasting".

Typ zwracany

str

test_data

Pobieranie danych testowych.

Zwraca

Testowanie danych wejściowych

Typ zwracany

training_data

Pobieranie danych szkoleniowych.

Zwraca

Dane wejściowe danych szkoleniowych

Typ zwracany

training_parameters

type

Typ zadania.

Zwraca

Typ zadania.

Typ zwracany

validation_data

Pobieranie danych weryfikacji.

Zwraca

Dane wejściowe danych walidacji

Typ zwracany