Udostępnij za pośrednictwem


TextClassificationJob Klasa

Konfiguracja zadania klasyfikacji tekstu zautomatyzowanego uczenia maszynowego.

Inicjuje nowe zadanie klasyfikacji tekstu zautomatyzowanego uczenia maszynowego.

Dziedziczenie
azure.ai.ml.entities._job.automl.nlp.automl_nlp_job.AutoMLNLPJob
TextClassificationJob

Konstruktor

TextClassificationJob(*, target_column_name: str | None = None, training_data: Input | None = None, validation_data: Input | None = None, primary_metric: ClassificationPrimaryMetrics | None = None, log_verbosity: str | None = None, **kwargs)

Parametry

target_column_name
Wymagane

Nazwa kolumny docelowej

training_data
Wymagane

Dane szkoleniowe, które mają być używane do trenowania

validation_data
Wymagane

Dane weryfikacji, które mają być używane do oceny wytrenowanego modelu

primary_metric
Wymagane

Podstawowa metryka do wyświetlenia

log_verbosity
Wymagane

Poziom szczegółowości dziennika

kwargs
Wymagane

Argumenty specyficzne dla zadania

Metody

dump

Zrzuty zawartości zadania do pliku w formacie YAML.

extend_search_space

Dodaj (a) spacje wyszukiwania dla tego zadania automatycznego równoważenia obciążenia sieciowego.

set_data
set_featurization
set_limits
set_sweep

Ustawienia zamiatania dla wszystkich zadań nlp rozwiązania AutoML.

set_training_parameters

Napraw niektóre parametry trenowania w całej procedurze szkoleniowej dla wszystkich kandydatów.

Przekazać. Musi to być dodatnia liczba całkowita. :keyword learning_rate: początkowa szybkość nauki. Musi być zmiennoprzecinkiem (0, 1). :keyword learning_rate_scheduler: typ harmonogramu szybkości nauki. Należy wybrać jedną z wartości "liniowych", "cosinus", "cosine_with_restarts", "wielomianu", "stałej" i "constant_with_warmup". :keyword model_name: nazwa modelu do użycia podczas trenowania. Należy wybrać spośród "bert-base-cased", "bert-base-uncased", "bert-base-multilingual-cased", "bert-base-german-cased", "bert-large-cased", "bert-large-uncased", "distilbert-base-cased", "distilbert-base-uncased", "roberta-base", "roberta-large", "distilroberta-base", "xlm-roberta-base", "xlm-roberta-large", xlnet-base-cased" i "xlnet-large-cased". :keyword number_of_epochs: liczba epok do trenowania. Musi być dodatnią liczbą całkowitą. :keyword training_batch_size: rozmiar partii podczas trenowania. Musi być dodatnią liczbą całkowitą. :keyword validation_batch_size: rozmiar partii podczas walidacji. Musi być dodatnią liczbą całkowitą. :słowo kluczowe warmup_ratio: stosunek całkowitej liczby kroków trenowania używanych do liniowego rozgrzewki z zakresu od 0 do learning_rate. Musi być zmiennoprzecinkiem [0, 1]. :słowo kluczowe weight_decay: wartość rozkładu wagi, gdy optymalizator jest sgd, adam lub adamw. Musi to być liczba zmiennoprzecinkowa w zakresie [0, 1]. :return: Brak.

dump

Zrzuty zawartości zadania do pliku w formacie YAML.

dump(dest: str | PathLike | IO, **kwargs) -> None

Parametry

dest
Union[<xref:PathLike>, str, IO[AnyStr]]
Wymagane

Ścieżka lokalna lub strumień plików do zapisu zawartości YAML. Jeśli dest jest ścieżką pliku, zostanie utworzony nowy plik. Jeśli plik jest otwarty, plik zostanie zapisany bezpośrednio.

kwargs
dict

Dodatkowe argumenty do przekazania do serializatora YAML.

Wyjątki

Zgłaszane, jeśli dest jest ścieżką pliku i plik już istnieje.

Zgłaszane, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.

extend_search_space

Dodaj (a) spacje wyszukiwania dla tego zadania automatycznego równoważenia obciążenia sieciowego.

extend_search_space(value: SearchSpace | List[SearchSpace]) -> None

Parametry

value
Union[SearchSpace, List[SearchSpace]]
Wymagane

obiekt SearchSpace lub lista obiektów SearchSpace z parametrami specyficznymi dla nlp.

Zwraca

Brak.

Wyjątki

Zgłaszane, jeśli dest jest ścieżką pliku i plik już istnieje.

Zgłaszane, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.

set_data

set_data(*, training_data: Input, target_column_name: str, validation_data: Input) -> None

Wyjątki

Zgłaszane, jeśli dest jest ścieżką pliku i plik już istnieje.

Zgłaszane, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.

set_featurization

set_featurization(*, dataset_language: str | None = None) -> None

Wyjątki

Zgłaszane, jeśli dest jest ścieżką pliku i plik już istnieje.

Zgłaszane, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.

set_limits

set_limits(*, max_trials: int = 1, max_concurrent_trials: int = 1, max_nodes: int = 1, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None

Wyjątki

Zgłaszane, jeśli dest jest ścieżką pliku i plik już istnieje.

Zgłaszane, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.

set_sweep

Ustawienia zamiatania dla wszystkich zadań nlp rozwiązania AutoML.

set_sweep(*, sampling_algorithm: str | SamplingAlgorithmType, early_termination: EarlyTerminationPolicy | None = None)

Parametry

sampling_algorithm

Wymagane. Określa typ algorytmu próbkowania hiperparametrów. Możliwe wartości to: "Grid", "Random" i "Bayesian".

early_termination

Opcjonalne zasady wczesnego zakończenia, aby zakończyć słabe wyniki szkolenia kandydatów.

Zwraca

Brak

Wyjątki

Zgłaszane, jeśli dest jest ścieżką pliku i plik już istnieje.

Zgłaszane, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.

set_training_parameters

Napraw niektóre parametry trenowania w całej procedurze szkoleniowej dla wszystkich kandydatów.

Przekazać. Musi to być dodatnia liczba całkowita. :keyword learning_rate: początkowa szybkość nauki. Musi być zmiennoprzecinkiem (0, 1). :keyword learning_rate_scheduler: typ harmonogramu szybkości nauki. Należy wybrać jedną z wartości "liniowych", "cosinus", "cosine_with_restarts", "wielomianu", "stałej" i "constant_with_warmup". :keyword model_name: nazwa modelu do użycia podczas trenowania. Należy wybrać spośród "bert-base-cased", "bert-base-uncased", "bert-base-multilingual-cased", "bert-base-german-cased", "bert-large-cased", "bert-large-uncased", "distilbert-base-cased", "distilbert-base-uncased", "roberta-base", "roberta-large", "distilroberta-base", "xlm-roberta-base", "xlm-roberta-large", xlnet-base-cased" i "xlnet-large-cased". :keyword number_of_epochs: liczba epok do trenowania. Musi być dodatnią liczbą całkowitą. :keyword training_batch_size: rozmiar partii podczas trenowania. Musi być dodatnią liczbą całkowitą. :keyword validation_batch_size: rozmiar partii podczas walidacji. Musi być dodatnią liczbą całkowitą. :słowo kluczowe warmup_ratio: stosunek całkowitej liczby kroków trenowania używanych do liniowego rozgrzewki z zakresu od 0 do learning_rate. Musi być zmiennoprzecinkiem [0, 1]. :słowo kluczowe weight_decay: wartość rozkładu wagi, gdy optymalizator jest sgd, adam lub adamw. Musi to być liczba zmiennoprzecinkowa w zakresie [0, 1]. :return: Brak.

set_training_parameters(*, gradient_accumulation_steps: int | None = None, learning_rate: float | None = None, learning_rate_scheduler: str | NlpLearningRateScheduler | None = None, model_name: str | None = None, number_of_epochs: int | None = None, training_batch_size: int | None = None, validation_batch_size: int | None = None, warmup_ratio: float | None = None, weight_decay: float | None = None) -> None

Parametry

gradient_accumulation_steps

liczba kroków, nad którymi należy gromadzić gradienty przed tyłem

Wyjątki

Zgłaszane, jeśli dest jest ścieżką pliku i plik już istnieje.

Zgłaszane, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.

Atrybuty

base_path

Ścieżka podstawowa zasobu.

Zwraca

Ścieżka podstawowa zasobu.

Typ zwracany

str

creation_context

Kontekst tworzenia zasobu.

Zwraca

Metadane tworzenia zasobu.

Typ zwracany

featurization

id

Identyfikator zasobu.

Zwraca

Identyfikator globalny zasobu, identyfikator usługi Azure Resource Manager (ARM).

Typ zwracany

inputs

limits

log_files

Pliki wyjściowe zadania.

Zwraca

Słownik nazw dzienników i adresów URL.

Typ zwracany

log_verbosity

outputs

primary_metric

search_space

status

Stan zadania.

Zwracane typowe wartości to "Running", "Completed" i "Failed". Wszystkie możliwe wartości to:

  • NotStarted — jest to stan tymczasowy, w przypadku którego przed przesłaniem do chmury znajdują się obiekty Uruchom po stronie klienta.

  • Uruchamianie — uruchomienie zostało rozpoczęte w chmurze. Obiekt wywołujący ma w tym momencie identyfikator uruchomienia.

  • Aprowizacja — obliczenia na żądanie są tworzone dla danego przesłania zadania.

  • Przygotowywanie — środowisko uruchomieniowe jest przygotowywane i znajduje się w jednym z dwóch etapów:

    • Kompilacja obrazu platformy Docker

    • Konfiguracja środowiska conda

  • W kolejce — zadanie jest kolejkowane w docelowym obiekcie obliczeniowym. Na przykład w usłudze BatchAI zadanie jest w stanie w kolejce

    podczas oczekiwania na gotowość wszystkich żądanych węzłów.

  • Uruchomione — zadanie zostało uruchomione na docelowym obiekcie obliczeniowym.

  • Finalizowanie — wykonywanie kodu użytkownika zostało ukończone, a przebieg znajduje się na etapach przetwarzania końcowego.

  • CancelRequested — zażądano anulowania zadania.

  • Ukończono — przebieg został ukończony pomyślnie. Obejmuje to zarówno wykonywanie kodu użytkownika, jak i uruchamianie

    etapy przetwarzania końcowego.

  • Niepowodzenie — przebieg zakończył się niepowodzeniem. Zazwyczaj właściwość Error w przebiegu zawiera szczegółowe informacje o przyczynie.

  • Anulowano — następuje żądanie anulowania i wskazuje, że przebieg został pomyślnie anulowany.

  • NotResponding — w przypadku przebiegów z włączonymi pulsami nie wysłano ostatnio pulsu.

Zwraca

Stan zadania.

Typ zwracany

studio_url

Punkt końcowy programu Azure ML Studio.

Zwraca

Adres URL strony szczegółów zadania.

Typ zwracany

sweep

task_type

Pobierz typ zadania.

Zwraca

Typ zadania do uruchomienia. Możliwe wartości to: "classification", "regression", "forecasting".

Typ zwracany

str

test_data

Pobieranie danych testowych.

Zwraca

Testowanie danych wejściowych

Typ zwracany

training_data

Pobieranie danych treningowych.

Zwraca

Dane wejściowe danych szkoleniowych

Typ zwracany

training_parameters

type

Typ zadania.

Zwraca

Typ zadania.

Typ zwracany

validation_data

Pobieranie danych weryfikacji.

Zwraca

Dane wejściowe danych walidacji

Typ zwracany