TextClassificationMultilabelJob Klasa
Konfiguracja zadania wieloznakowego klasyfikacji tekstu autoML.
Inicjuje nowe zadanie multilabel klasyfikacji tekstu automatycznego uczenia maszynowego.
- Dziedziczenie
-
azure.ai.ml.entities._job.automl.nlp.automl_nlp_job.AutoMLNLPJobTextClassificationMultilabelJob
Konstruktor
TextClassificationMultilabelJob(*, target_column_name: str | None = None, training_data: Input | None = None, validation_data: Input | None = None, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs)
Parametry
- target_column_name
Nazwa kolumny docelowej
- training_data
Dane szkoleniowe, które mają być używane do trenowania
- validation_data
Dane weryfikacji, które mają być używane do oceny wytrenowanego modelu
- primary_metric
Wyświetlana jest podstawowa metryka.
- log_verbosity
Poziom szczegółowości dziennika
- kwargs
Argumenty specyficzne dla zadania
Metody
dump |
Zrzuty zawartości zadania do pliku w formacie YAML. |
extend_search_space |
Dodaj (a) spacje wyszukiwania dla tego zadania nlP rozwiązania AutoML. |
set_data | |
set_featurization | |
set_limits | |
set_sweep |
Zamiatanie ustawień dla wszystkich zadań równoważenia obciążenia sieciowego automatycznego uczenia maszynowego. |
set_training_parameters |
Napraw niektóre parametry treningowe w całej procedurze szkoleniowej dla wszystkich kandydatów. Przekazać. Musi to być dodatnia liczba całkowita. :słowo kluczowe learning_rate: początkowa szybkość nauki. Musi być zmiennoprzecinkowym (0, 1). :słowo kluczowe learning_rate_scheduler: typ harmonogramu szybkości nauki. Należy wybrać jedną z opcji "liniowych", "cosinus", "cosine_with_restarts", "wielomianu", "stałej" i "constant_with_warmup". :słowo kluczowe model_name: nazwa modelu do użycia podczas trenowania. Musi wybrać "bert-base-cased", "bert-base-uncased", "bert-base-multilingual-cased", "bert-base-german-cased", "bert-large-cased", "bert-large-uncased", "distilbert-base-cased", "distilbert-base-uncased", "roberta-base", "roberta-large", "distilroberta-base", "xlm-roberta-base", "xlm-roberta-large", xlnet-base-cased" i "xlnet-large-cased". :słowo kluczowe number_of_epochs: liczba epok do trenowania. Musi być dodatnią liczbą całkowitą. :słowo kluczowe training_batch_size: rozmiar partii podczas trenowania. Musi być dodatnią liczbą całkowitą. :słowo kluczowe validation_batch_size: rozmiar partii podczas walidacji. Musi być dodatnią liczbą całkowitą. :słowo kluczowe warmup_ratio: stosunek łącznych kroków treningowych używanych do rozgrzewki liniowej z zakresu od 0 do learning_rate. Musi być zmiennoprzecinkowym w [0, 1]. :słowo kluczowe weight_decay: wartość rozpadu wagi, gdy optymalizator jest sgd, adam lub adamw. Musi to być zmiennoprzecinkowy w zakresie [0, 1]. :return: Brak. |
dump
Zrzuty zawartości zadania do pliku w formacie YAML.
dump(dest: str | PathLike | IO, **kwargs) -> None
Parametry
Ścieżka lokalna lub strumień plików do zapisania zawartości YAML do. Jeśli dest jest ścieżką pliku, zostanie utworzony nowy plik. Jeśli dest jest otwartym plikiem, plik zostanie zapisany bezpośrednio.
- kwargs
- dict
Dodatkowe argumenty do przekazania do serializatora YAML.
Wyjątki
Podniesione, jeśli dest jest ścieżką pliku i plik już istnieje.
Podniesione, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.
extend_search_space
Dodaj (a) spacje wyszukiwania dla tego zadania nlP rozwiązania AutoML.
extend_search_space(value: SearchSpace | List[SearchSpace]) -> None
Parametry
- value
- Union[SearchSpace, List[SearchSpace]]
obiekt SearchSpace lub lista obiektów SearchSpace z parametrami specyficznymi dla nlp.
Zwraca
Brak.
Wyjątki
Podniesione, jeśli dest jest ścieżką pliku i plik już istnieje.
Podniesione, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.
set_data
set_data(*, training_data: Input, target_column_name: str, validation_data: Input) -> None
Wyjątki
Podniesione, jeśli dest jest ścieżką pliku i plik już istnieje.
Podniesione, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.
set_featurization
set_featurization(*, dataset_language: str | None = None) -> None
Wyjątki
Podniesione, jeśli dest jest ścieżką pliku i plik już istnieje.
Podniesione, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.
set_limits
set_limits(*, max_trials: int = 1, max_concurrent_trials: int = 1, max_nodes: int = 1, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None
Wyjątki
Podniesione, jeśli dest jest ścieżką pliku i plik już istnieje.
Podniesione, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.
set_sweep
Zamiatanie ustawień dla wszystkich zadań równoważenia obciążenia sieciowego automatycznego uczenia maszynowego.
set_sweep(*, sampling_algorithm: str | SamplingAlgorithmType, early_termination: EarlyTerminationPolicy | None = None)
Parametry
- sampling_algorithm
Wymagane. Określa typ algorytmu próbkowania hiperparametrów. Możliwe wartości to: "Grid", "Random" i "Bayesian".
- early_termination
Opcjonalne zasady wczesnego zakończenia, aby zakończyć słabe wyniki szkolenia kandydatów.
Zwraca
Brak
Wyjątki
Podniesione, jeśli dest jest ścieżką pliku i plik już istnieje.
Podniesione, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.
set_training_parameters
Napraw niektóre parametry treningowe w całej procedurze szkoleniowej dla wszystkich kandydatów.
Przekazać. Musi to być dodatnia liczba całkowita. :słowo kluczowe learning_rate: początkowa szybkość nauki. Musi być zmiennoprzecinkowym (0, 1). :słowo kluczowe learning_rate_scheduler: typ harmonogramu szybkości nauki. Należy wybrać jedną z opcji "liniowych", "cosinus", "cosine_with_restarts", "wielomianu", "stałej" i "constant_with_warmup". :słowo kluczowe model_name: nazwa modelu do użycia podczas trenowania. Musi wybrać "bert-base-cased", "bert-base-uncased", "bert-base-multilingual-cased", "bert-base-german-cased", "bert-large-cased", "bert-large-uncased", "distilbert-base-cased", "distilbert-base-uncased", "roberta-base", "roberta-large", "distilroberta-base", "xlm-roberta-base", "xlm-roberta-large", xlnet-base-cased" i "xlnet-large-cased". :słowo kluczowe number_of_epochs: liczba epok do trenowania. Musi być dodatnią liczbą całkowitą. :słowo kluczowe training_batch_size: rozmiar partii podczas trenowania. Musi być dodatnią liczbą całkowitą. :słowo kluczowe validation_batch_size: rozmiar partii podczas walidacji. Musi być dodatnią liczbą całkowitą. :słowo kluczowe warmup_ratio: stosunek łącznych kroków treningowych używanych do rozgrzewki liniowej z zakresu od 0 do learning_rate. Musi być zmiennoprzecinkowym w [0, 1]. :słowo kluczowe weight_decay: wartość rozpadu wagi, gdy optymalizator jest sgd, adam lub adamw. Musi to być zmiennoprzecinkowy w zakresie [0, 1]. :return: Brak.
set_training_parameters(*, gradient_accumulation_steps: int | None = None, learning_rate: float | None = None, learning_rate_scheduler: str | NlpLearningRateScheduler | None = None, model_name: str | None = None, number_of_epochs: int | None = None, training_batch_size: int | None = None, validation_batch_size: int | None = None, warmup_ratio: float | None = None, weight_decay: float | None = None) -> None
Parametry
- gradient_accumulation_steps
liczba kroków, na które mają być skumulowane gradienty przed tyłem
Wyjątki
Podniesione, jeśli dest jest ścieżką pliku i plik już istnieje.
Podniesione, jeśli dest jest otwartym plikiem, a plik nie jest zapisywalny.
Atrybuty
base_path
creation_context
featurization
id
Identyfikator zasobu.
Zwraca
Globalny identyfikator zasobu, identyfikator usługi Azure Resource Manager (ARM).
Typ zwracany
inputs
limits
log_files
Pliki wyjściowe zadania.
Zwraca
Słownik nazw dzienników i adresów URL.
Typ zwracany
log_verbosity
outputs
primary_metric
search_space
status
Stan zadania.
Zwracane wspólne wartości to "Running", "Completed" i "Failed". Wszystkie możliwe wartości to:
NotStarted — jest to stan tymczasowy, w przypadku którego przed przesłaniem chmury znajdują się obiekty Uruchom po stronie klienta.
Uruchamianie — uruchamianie zaczęło być przetwarzane w chmurze. Obiekt wywołujący ma w tym momencie identyfikator uruchomienia.
Aprowizowanie — zasoby obliczeniowe na żądanie są tworzone dla danego przesłania zadania.
Przygotowywanie — środowisko uruchamiania jest przygotowane i znajduje się w jednym z dwóch etapów:
Kompilacja obrazu platformy Docker
Konfiguracja środowiska conda
Queued — zadanie jest w kolejce w obiekcie docelowym obliczeniowym. Na przykład w usłudze BatchAI zadanie jest w stanie w kolejce
czekając na gotowość wszystkich żądanych węzłów.
Uruchomiono — zadanie zostało uruchomione na docelowym obiekcie obliczeniowym.
Finalizowanie — wykonanie kodu użytkownika zostało ukończone, a przebieg znajduje się na etapach przetwarzania końcowego.
CancelRequested — zażądano anulowania zadania.
Ukończono — przebieg został ukończony pomyślnie. Obejmuje to zarówno wykonywanie kodu użytkownika, jak i uruchamianie
etapy przetwarzania końcowego.
Niepowodzenie — przebieg zakończył się niepowodzeniem. Zazwyczaj właściwość Error w przebiegu zawiera szczegółowe informacje o przyczynie.
Anulowano — następuje żądanie anulowania i wskazuje, że przebieg został pomyślnie anulowany.
Brak odpowiedzi — w przypadku przebiegów z włączonymi pulsami nie wysłano ostatnio żadnego pulsu.
Zwraca
Stan zadania.
Typ zwracany
studio_url
Punkt końcowy usługi Azure ML Studio.
Zwraca
Adres URL strony szczegółów zadania.
Typ zwracany
sweep
task_type
Pobierz typ zadania.
Zwraca
Typ zadania do uruchomienia. Możliwe wartości to: "classification", "regression", "forecasting".
Typ zwracany
test_data
training_data
training_parameters
type
validation_data
Azure SDK for Python
Opinia
https://aka.ms/ContentUserFeedback.
Dostępne już wkrótce: W 2024 r. będziemy stopniowo wycofywać zgłoszenia z serwisu GitHub jako mechanizm przesyłania opinii na temat zawartości i zastępować go nowym systemem opinii. Aby uzyskać więcej informacji, sprawdź:Prześlij i wyświetl opinię dla