TextClassificationJob Klasa
Konfiguracja zadania klasyfikacji tekstu zautomatyzowanego uczenia maszynowego.
Inicjuje nowe zadanie klasyfikacji tekstu zautomatyzowanego uczenia maszynowego.
- Dziedziczenie
-
azure.ai.ml.entities._job.automl.nlp.automl_nlp_job.AutoMLNLPJobTextClassificationJob
Konstruktor
TextClassificationJob(*, target_column_name: str | None = None, training_data: Input | None = None, validation_data: Input | None = None, primary_metric: ClassificationPrimaryMetrics | None = None, log_verbosity: str | None = None, **kwargs)
Parametry
- target_column_name
Nazwa kolumny docelowej
- training_data
Dane szkoleniowe, które mają być używane do trenowania
- validation_data
Dane weryfikacji, które mają być używane do oceny wytrenowanego modelu
- primary_metric
Podstawowa metryka do wyświetlenia
- log_verbosity
Poziom szczegółowości dziennika
- kwargs
Argumenty specyficzne dla zadania
Metody
dump |
Zrzuty zawartości zadania do pliku w formacie YAML. |
extend_search_space |
Dodaj (a) spacje wyszukiwania dla tego zadania automatycznego równoważenia obciążenia sieciowego. |
set_data | |
set_featurization | |
set_limits | |
set_sweep |
Ustawienia zamiatania dla wszystkich zadań nlp rozwiązania AutoML. |
set_training_parameters |
Napraw niektóre parametry trenowania w całej procedurze szkoleniowej dla wszystkich kandydatów. Przekazać. Musi to być dodatnia liczba całkowita. :keyword learning_rate: początkowa szybkość nauki. Musi być zmiennoprzecinkiem (0, 1). :keyword learning_rate_scheduler: typ harmonogramu szybkości nauki. Należy wybrać jedną z wartości "liniowych", "cosinus", "cosine_with_restarts", "wielomianu", "stałej" i "constant_with_warmup". :keyword model_name: nazwa modelu do użycia podczas trenowania. Należy wybrać spośród "bert-base-cased", "bert-base-uncased", "bert-base-multilingual-cased", "bert-base-german-cased", "bert-large-cased", "bert-large-uncased", "distilbert-base-cased", "distilbert-base-uncased", "roberta-base", "roberta-large", "distilroberta-base", "xlm-roberta-base", "xlm-roberta-large", xlnet-base-cased" i "xlnet-large-cased". :keyword number_of_epochs: liczba epok do trenowania. Musi być dodatnią liczbą całkowitą. :keyword training_batch_size: rozmiar partii podczas trenowania. Musi być dodatnią liczbą całkowitą. :keyword validation_batch_size: rozmiar partii podczas walidacji. Musi być dodatnią liczbą całkowitą. :słowo kluczowe warmup_ratio: stosunek całkowitej liczby kroków trenowania używanych do liniowego rozgrzewki z zakresu od 0 do learning_rate. Musi być zmiennoprzecinkiem [0, 1]. :słowo kluczowe weight_decay: wartość rozkładu wagi, gdy optymalizator jest sgd, adam lub adamw. Musi to być liczba zmiennoprzecinkowa w zakresie [0, 1]. :return: Brak. |
dump
Zrzuty zawartości zadania do pliku w formacie YAML.
dump(dest: str | PathLike | IO, **kwargs) -> None
Parametry
Ścieżka lokalna lub strumień plików do zapisu zawartości YAML. Jeśli dest jest ścieżką pliku, zostanie utworzony nowy plik. Jeśli plik jest otwarty, plik zostanie zapisany bezpośrednio.
- kwargs
- dict
Dodatkowe argumenty do przekazania do serializatora YAML.
Wyjątki
Zgłaszane, jeśli dest jest ścieżką pliku i plik już istnieje.
Zgłaszane, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.
extend_search_space
Dodaj (a) spacje wyszukiwania dla tego zadania automatycznego równoważenia obciążenia sieciowego.
extend_search_space(value: SearchSpace | List[SearchSpace]) -> None
Parametry
- value
- Union[SearchSpace, List[SearchSpace]]
obiekt SearchSpace lub lista obiektów SearchSpace z parametrami specyficznymi dla nlp.
Zwraca
Brak.
Wyjątki
Zgłaszane, jeśli dest jest ścieżką pliku i plik już istnieje.
Zgłaszane, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.
set_data
set_data(*, training_data: Input, target_column_name: str, validation_data: Input) -> None
Wyjątki
Zgłaszane, jeśli dest jest ścieżką pliku i plik już istnieje.
Zgłaszane, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.
set_featurization
set_featurization(*, dataset_language: str | None = None) -> None
Wyjątki
Zgłaszane, jeśli dest jest ścieżką pliku i plik już istnieje.
Zgłaszane, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.
set_limits
set_limits(*, max_trials: int = 1, max_concurrent_trials: int = 1, max_nodes: int = 1, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None
Wyjątki
Zgłaszane, jeśli dest jest ścieżką pliku i plik już istnieje.
Zgłaszane, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.
set_sweep
Ustawienia zamiatania dla wszystkich zadań nlp rozwiązania AutoML.
set_sweep(*, sampling_algorithm: str | SamplingAlgorithmType, early_termination: EarlyTerminationPolicy | None = None)
Parametry
- sampling_algorithm
Wymagane. Określa typ algorytmu próbkowania hiperparametrów. Możliwe wartości to: "Grid", "Random" i "Bayesian".
- early_termination
Opcjonalne zasady wczesnego zakończenia, aby zakończyć słabe wyniki szkolenia kandydatów.
Zwraca
Brak
Wyjątki
Zgłaszane, jeśli dest jest ścieżką pliku i plik już istnieje.
Zgłaszane, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.
set_training_parameters
Napraw niektóre parametry trenowania w całej procedurze szkoleniowej dla wszystkich kandydatów.
Przekazać. Musi to być dodatnia liczba całkowita. :keyword learning_rate: początkowa szybkość nauki. Musi być zmiennoprzecinkiem (0, 1). :keyword learning_rate_scheduler: typ harmonogramu szybkości nauki. Należy wybrać jedną z wartości "liniowych", "cosinus", "cosine_with_restarts", "wielomianu", "stałej" i "constant_with_warmup". :keyword model_name: nazwa modelu do użycia podczas trenowania. Należy wybrać spośród "bert-base-cased", "bert-base-uncased", "bert-base-multilingual-cased", "bert-base-german-cased", "bert-large-cased", "bert-large-uncased", "distilbert-base-cased", "distilbert-base-uncased", "roberta-base", "roberta-large", "distilroberta-base", "xlm-roberta-base", "xlm-roberta-large", xlnet-base-cased" i "xlnet-large-cased". :keyword number_of_epochs: liczba epok do trenowania. Musi być dodatnią liczbą całkowitą. :keyword training_batch_size: rozmiar partii podczas trenowania. Musi być dodatnią liczbą całkowitą. :keyword validation_batch_size: rozmiar partii podczas walidacji. Musi być dodatnią liczbą całkowitą. :słowo kluczowe warmup_ratio: stosunek całkowitej liczby kroków trenowania używanych do liniowego rozgrzewki z zakresu od 0 do learning_rate. Musi być zmiennoprzecinkiem [0, 1]. :słowo kluczowe weight_decay: wartość rozkładu wagi, gdy optymalizator jest sgd, adam lub adamw. Musi to być liczba zmiennoprzecinkowa w zakresie [0, 1]. :return: Brak.
set_training_parameters(*, gradient_accumulation_steps: int | None = None, learning_rate: float | None = None, learning_rate_scheduler: str | NlpLearningRateScheduler | None = None, model_name: str | None = None, number_of_epochs: int | None = None, training_batch_size: int | None = None, validation_batch_size: int | None = None, warmup_ratio: float | None = None, weight_decay: float | None = None) -> None
Parametry
- gradient_accumulation_steps
liczba kroków, nad którymi należy gromadzić gradienty przed tyłem
Wyjątki
Zgłaszane, jeśli dest jest ścieżką pliku i plik już istnieje.
Zgłaszane, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.
Atrybuty
base_path
creation_context
featurization
id
Identyfikator zasobu.
Zwraca
Identyfikator globalny zasobu, identyfikator usługi Azure Resource Manager (ARM).
Typ zwracany
inputs
limits
log_files
Pliki wyjściowe zadania.
Zwraca
Słownik nazw dzienników i adresów URL.
Typ zwracany
log_verbosity
outputs
primary_metric
search_space
status
Stan zadania.
Zwracane typowe wartości to "Running", "Completed" i "Failed". Wszystkie możliwe wartości to:
NotStarted — jest to stan tymczasowy, w przypadku którego przed przesłaniem do chmury znajdują się obiekty Uruchom po stronie klienta.
Uruchamianie — uruchomienie zostało rozpoczęte w chmurze. Obiekt wywołujący ma w tym momencie identyfikator uruchomienia.
Aprowizacja — obliczenia na żądanie są tworzone dla danego przesłania zadania.
Przygotowywanie — środowisko uruchomieniowe jest przygotowywane i znajduje się w jednym z dwóch etapów:
Kompilacja obrazu platformy Docker
Konfiguracja środowiska conda
W kolejce — zadanie jest kolejkowane w docelowym obiekcie obliczeniowym. Na przykład w usłudze BatchAI zadanie jest w stanie w kolejce
podczas oczekiwania na gotowość wszystkich żądanych węzłów.
Uruchomione — zadanie zostało uruchomione na docelowym obiekcie obliczeniowym.
Finalizowanie — wykonywanie kodu użytkownika zostało ukończone, a przebieg znajduje się na etapach przetwarzania końcowego.
CancelRequested — zażądano anulowania zadania.
Ukończono — przebieg został ukończony pomyślnie. Obejmuje to zarówno wykonywanie kodu użytkownika, jak i uruchamianie
etapy przetwarzania końcowego.
Niepowodzenie — przebieg zakończył się niepowodzeniem. Zazwyczaj właściwość Error w przebiegu zawiera szczegółowe informacje o przyczynie.
Anulowano — następuje żądanie anulowania i wskazuje, że przebieg został pomyślnie anulowany.
NotResponding — w przypadku przebiegów z włączonymi pulsami nie wysłano ostatnio pulsu.
Zwraca
Stan zadania.
Typ zwracany
studio_url
Punkt końcowy programu Azure ML Studio.
Zwraca
Adres URL strony szczegółów zadania.
Typ zwracany
sweep
task_type
Pobierz typ zadania.
Zwraca
Typ zadania do uruchomienia. Możliwe wartości to: "classification", "regression", "forecasting".
Typ zwracany
test_data
training_data
training_parameters
type
validation_data
Azure SDK for Python