TextClassificationJob Klasa

Odwołanie

Konfiguracja zadania klasyfikacji tekstu zautomatyzowanego uczenia maszynowego.

Inicjuje nowe zadanie klasyfikacji tekstu zautomatyzowanego uczenia maszynowego.

Dziedziczenie: azure.ai.ml.entities._job.automl.nlp.automl_nlp_job.AutoMLNLPJob

TextClassificationJob

Konstruktor

TextClassificationJob(*, target_column_name: str | None = None, training_data: Input | None = None, validation_data: Input | None = None, primary_metric: ClassificationPrimaryMetrics | None = None, log_verbosity: str | None = None, **kwargs)

Parametry

target_column_name

Wymagane

Nazwa kolumny docelowej

training_data

Wymagane

Dane szkoleniowe, które mają być używane do trenowania

validation_data

Wymagane

Dane weryfikacji, które mają być używane do oceny wytrenowanego modelu

primary_metric

Wymagane

Podstawowa metryka do wyświetlenia

log_verbosity

Wymagane

Poziom szczegółowości dziennika

kwargs

Wymagane

Argumenty specyficzne dla zadania

Metody

dump	Zrzuty zawartości zadania do pliku w formacie YAML.
extend_search_space	Dodaj (a) spacje wyszukiwania dla tego zadania automatycznego równoważenia obciążenia sieciowego.
set_data
set_featurization
set_limits
set_sweep	Ustawienia zamiatania dla wszystkich zadań nlp rozwiązania AutoML.
set_training_parameters	Napraw niektóre parametry trenowania w całej procedurze szkoleniowej dla wszystkich kandydatów. Przekazać. Musi to być dodatnia liczba całkowita. :keyword learning_rate: początkowa szybkość nauki. Musi być zmiennoprzecinkiem (0, 1). :keyword learning_rate_scheduler: typ harmonogramu szybkości nauki. Należy wybrać jedną z wartości "liniowych", "cosinus", "cosine_with_restarts", "wielomianu", "stałej" i "constant_with_warmup". :keyword model_name: nazwa modelu do użycia podczas trenowania. Należy wybrać spośród "bert-base-cased", "bert-base-uncased", "bert-base-multilingual-cased", "bert-base-german-cased", "bert-large-cased", "bert-large-uncased", "distilbert-base-cased", "distilbert-base-uncased", "roberta-base", "roberta-large", "distilroberta-base", "xlm-roberta-base", "xlm-roberta-large", xlnet-base-cased" i "xlnet-large-cased". :keyword number_of_epochs: liczba epok do trenowania. Musi być dodatnią liczbą całkowitą. :keyword training_batch_size: rozmiar partii podczas trenowania. Musi być dodatnią liczbą całkowitą. :keyword validation_batch_size: rozmiar partii podczas walidacji. Musi być dodatnią liczbą całkowitą. :słowo kluczowe warmup_ratio: stosunek całkowitej liczby kroków trenowania używanych do liniowego rozgrzewki z zakresu od 0 do learning_rate. Musi być zmiennoprzecinkiem [0, 1]. :słowo kluczowe weight_decay: wartość rozkładu wagi, gdy optymalizator jest sgd, adam lub adamw. Musi to być liczba zmiennoprzecinkowa w zakresie [0, 1]. :return: Brak.

dump

Zrzuty zawartości zadania do pliku w formacie YAML.

dump(dest: str | PathLike | IO, **kwargs) -> None

Parametry

dest: Union[<xref:PathLike>, str, IO[AnyStr]]

Wymagane

Ścieżka lokalna lub strumień plików do zapisu zawartości YAML. Jeśli dest jest ścieżką pliku, zostanie utworzony nowy plik. Jeśli plik jest otwarty, plik zostanie zapisany bezpośrednio.

kwargs: dict

Dodatkowe argumenty do przekazania do serializatora YAML.

Wyjątki

FileExistsError

Zgłaszane, jeśli dest jest ścieżką pliku i plik już istnieje.

IOError

Zgłaszane, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.

extend_search_space

Dodaj (a) spacje wyszukiwania dla tego zadania automatycznego równoważenia obciążenia sieciowego.

extend_search_space(value: SearchSpace | List[SearchSpace]) -> None

Parametry

value: Union[SearchSpace, List[SearchSpace]]

Wymagane

obiekt SearchSpace lub lista obiektów SearchSpace z parametrami specyficznymi dla nlp.

Zwraca

Brak.

Wyjątki

FileExistsError

Zgłaszane, jeśli dest jest ścieżką pliku i plik już istnieje.

IOError

Zgłaszane, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.

set_data

set_data(*, training_data: Input, target_column_name: str, validation_data: Input) -> None

Wyjątki

FileExistsError

Zgłaszane, jeśli dest jest ścieżką pliku i plik już istnieje.

IOError

Zgłaszane, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.

set_featurization

set_featurization(*, dataset_language: str | None = None) -> None

Wyjątki

FileExistsError

Zgłaszane, jeśli dest jest ścieżką pliku i plik już istnieje.

IOError

Zgłaszane, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.

set_limits

set_limits(*, max_trials: int = 1, max_concurrent_trials: int = 1, max_nodes: int = 1, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None

Wyjątki

FileExistsError

Zgłaszane, jeśli dest jest ścieżką pliku i plik już istnieje.

IOError

Zgłaszane, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.

set_sweep

Ustawienia zamiatania dla wszystkich zadań nlp rozwiązania AutoML.

set_sweep(*, sampling_algorithm: str | SamplingAlgorithmType, early_termination: EarlyTerminationPolicy | None = None)

Parametry

sampling_algorithm

Wymagane. Określa typ algorytmu próbkowania hiperparametrów. Możliwe wartości to: "Grid", "Random" i "Bayesian".

early_termination

Opcjonalne zasady wczesnego zakończenia, aby zakończyć słabe wyniki szkolenia kandydatów.

Zwraca

Brak

Wyjątki

FileExistsError

Zgłaszane, jeśli dest jest ścieżką pliku i plik już istnieje.

IOError

Zgłaszane, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.

set_training_parameters

Napraw niektóre parametry trenowania w całej procedurze szkoleniowej dla wszystkich kandydatów.

Przekazać. Musi to być dodatnia liczba całkowita. :keyword learning_rate: początkowa szybkość nauki. Musi być zmiennoprzecinkiem (0, 1). :keyword learning_rate_scheduler: typ harmonogramu szybkości nauki. Należy wybrać jedną z wartości "liniowych", "cosinus", "cosine_with_restarts", "wielomianu", "stałej" i "constant_with_warmup". :keyword model_name: nazwa modelu do użycia podczas trenowania. Należy wybrać spośród "bert-base-cased", "bert-base-uncased", "bert-base-multilingual-cased", "bert-base-german-cased", "bert-large-cased", "bert-large-uncased", "distilbert-base-cased", "distilbert-base-uncased", "roberta-base", "roberta-large", "distilroberta-base", "xlm-roberta-base", "xlm-roberta-large", xlnet-base-cased" i "xlnet-large-cased". :keyword number_of_epochs: liczba epok do trenowania. Musi być dodatnią liczbą całkowitą. :keyword training_batch_size: rozmiar partii podczas trenowania. Musi być dodatnią liczbą całkowitą. :keyword validation_batch_size: rozmiar partii podczas walidacji. Musi być dodatnią liczbą całkowitą. :słowo kluczowe warmup_ratio: stosunek całkowitej liczby kroków trenowania używanych do liniowego rozgrzewki z zakresu od 0 do learning_rate. Musi być zmiennoprzecinkiem [0, 1]. :słowo kluczowe weight_decay: wartość rozkładu wagi, gdy optymalizator jest sgd, adam lub adamw. Musi to być liczba zmiennoprzecinkowa w zakresie [0, 1]. :return: Brak.

set_training_parameters(*, gradient_accumulation_steps: int | None = None, learning_rate: float | None = None, learning_rate_scheduler: str | NlpLearningRateScheduler | None = None, model_name: str | None = None, number_of_epochs: int | None = None, training_batch_size: int | None = None, validation_batch_size: int | None = None, warmup_ratio: float | None = None, weight_decay: float | None = None) -> None

Parametry

gradient_accumulation_steps

liczba kroków, nad którymi należy gromadzić gradienty przed tyłem

Wyjątki

FileExistsError

Zgłaszane, jeśli dest jest ścieżką pliku i plik już istnieje.

IOError

Zgłaszane, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.

Atrybuty

base_path

Ścieżka podstawowa zasobu.

Zwraca

Ścieżka podstawowa zasobu.

Typ zwracany

str

creation_context

Kontekst tworzenia zasobu.

Zwraca

Metadane tworzenia zasobu.

Typ zwracany

Optional[SystemData]

featurization

id

Identyfikator zasobu.

Zwraca

Identyfikator globalny zasobu, identyfikator usługi Azure Resource Manager (ARM).

Typ zwracany

Optional[str]

inputs

limits

log_files

Pliki wyjściowe zadania.

Zwraca

Słownik nazw dzienników i adresów URL.

Typ zwracany

Optional[Dict[str, str]]

log_verbosity

outputs

primary_metric

search_space

status

Stan zadania.

Zwracane typowe wartości to "Running", "Completed" i "Failed". Wszystkie możliwe wartości to:

NotStarted — jest to stan tymczasowy, w przypadku którego przed przesłaniem do chmury znajdują się obiekty Uruchom po stronie klienta.
Uruchamianie — uruchomienie zostało rozpoczęte w chmurze. Obiekt wywołujący ma w tym momencie identyfikator uruchomienia.
Aprowizacja — obliczenia na żądanie są tworzone dla danego przesłania zadania.
Przygotowywanie — środowisko uruchomieniowe jest przygotowywane i znajduje się w jednym z dwóch etapów:
- Kompilacja obrazu platformy Docker
- Konfiguracja środowiska conda
W kolejce — zadanie jest kolejkowane w docelowym obiekcie obliczeniowym. Na przykład w usłudze BatchAI zadanie jest w stanie w kolejce

podczas oczekiwania na gotowość wszystkich żądanych węzłów.
Uruchomione — zadanie zostało uruchomione na docelowym obiekcie obliczeniowym.
Finalizowanie — wykonywanie kodu użytkownika zostało ukończone, a przebieg znajduje się na etapach przetwarzania końcowego.
CancelRequested — zażądano anulowania zadania.
Ukończono — przebieg został ukończony pomyślnie. Obejmuje to zarówno wykonywanie kodu użytkownika, jak i uruchamianie

etapy przetwarzania końcowego.
Niepowodzenie — przebieg zakończył się niepowodzeniem. Zazwyczaj właściwość Error w przebiegu zawiera szczegółowe informacje o przyczynie.
Anulowano — następuje żądanie anulowania i wskazuje, że przebieg został pomyślnie anulowany.
NotResponding — w przypadku przebiegów z włączonymi pulsami nie wysłano ostatnio pulsu.

Zwraca

Stan zadania.

Typ zwracany

Optional[str]

studio_url

Punkt końcowy programu Azure ML Studio.

Zwraca

Adres URL strony szczegółów zadania.

Typ zwracany

Optional[str]

sweep

task_type

Pobierz typ zadania.

Zwraca

Typ zadania do uruchomienia. Możliwe wartości to: "classification", "regression", "forecasting".

Typ zwracany

str

test_data

Pobieranie danych testowych.

Zwraca

Testowanie danych wejściowych

Typ zwracany

Input

training_data

Pobieranie danych treningowych.

Zwraca

Dane wejściowe danych szkoleniowych

Typ zwracany

Input

training_parameters

type

Typ zadania.

Zwraca

Typ zadania.

Typ zwracany

Optional[str]

validation_data

Pobieranie danych weryfikacji.

Zwraca

Dane wejściowe danych walidacji

Typ zwracany

Input

Udostępnij za pośrednictwem

TextClassificationJob Klasa

Konstruktor

Parametry

Metody

dump

Parametry

Wyjątki

extend_search_space

Parametry

Zwraca

Wyjątki

set_data

Wyjątki

set_featurization

Wyjątki

set_limits

Wyjątki

set_sweep

Parametry

Zwraca

Wyjątki

set_training_parameters

Parametry

Wyjątki

Atrybuty

base_path

Zwraca

Typ zwracany

creation_context

Zwraca

Typ zwracany

featurization

id

Zwraca

Typ zwracany

inputs

limits

log_files

Zwraca

Typ zwracany

log_verbosity

outputs

primary_metric

search_space

status

Zwraca

Typ zwracany

studio_url

Zwraca

Typ zwracany

sweep

task_type

Zwraca

Typ zwracany

test_data

Zwraca

Typ zwracany

training_data

Zwraca

Typ zwracany

training_parameters

type

Zwraca

Typ zwracany

validation_data

Zwraca

Typ zwracany

Dodatkowe zasoby