TextClassificationMultilabelJob Klass
Konfiguration för AutoML-textklassificering med flera etiketter.
Initierar en ny AutoML-textklassificeringsaktivitet med flera etiketter.
- Arv
-
azure.ai.ml.entities._job.automl.nlp.automl_nlp_job.AutoMLNLPJobTextClassificationMultilabelJob
Konstruktor
TextClassificationMultilabelJob(*, target_column_name: str | None = None, training_data: Input | None = None, validation_data: Input | None = None, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs)
Parametrar
- target_column_name
Namnet på målkolumnen
- training_data
Träningsdata som ska användas för träning
- validation_data
Valideringsdata som ska användas för att utvärdera den tränade modellen
- primary_metric
Det primära måttet som ska visas.
- log_verbosity
Loggveroalitetsnivå
- kwargs
Jobbspecifika argument
Metoder
dump |
Dumpar jobbinnehållet till en fil i YAML-format. |
extend_search_space |
Lägg till (a) sökutrymmen för det här AutoML NLP-jobbet. |
set_data | |
set_featurization | |
set_limits | |
set_sweep |
Svepinställningar för alla AutoML NLP-uppgifter. |
set_training_parameters |
Åtgärda vissa träningsparametrar under hela träningsproceduren för alla kandidater. Passera. Detta måste vara ett positivt heltal. :keyword learning_rate: inledande inlärningstakt. Måste vara en flottör i (0, 1). :keyword learning_rate_scheduler: typen av learning rate scheduler. Måste välja mellan "linjär", "cosiné", "cosine_with_restarts", "polynom", "konstant" och "constant_with_warmup". :keyword model_name: modellnamnet som ska användas under träningen. Måste välja mellan "bert-base-cased", "bert-base-uncased", "bert-base-multilingual-cased", "bert-base-german-cased", "bert-large-cased", "bert-large-uncased", "destilbert-base-cased", "destilbert-base-uncased", "roberta-base", "roberta-large", "destilroberta-base", "xlm-roberta-base", "xlm-roberta-large", xlnet-base-cased" och "xlnet-large-cased". :keyword number_of_epochs: antalet epoker att träna med. Måste vara ett positivt heltal. :keyword training_batch_size: batchstorleken under träningen. Måste vara ett positivt heltal. :keyword validation_batch_size: batchstorleken under valideringen. Måste vara ett positivt heltal. :keyword warmup_ratio: förhållandet mellan totalt antal träningssteg som används för en linjär uppvärmning från 0 till learning_rate. Måste vara en flotte i [0, 1]. :keyword weight_decay: värdet för viktförfall när optimizern är sgd, adam eller adamw. Detta måste vara ett flyttal i intervallet [0, 1]. :return: Ingen. |
dump
Dumpar jobbinnehållet till en fil i YAML-format.
dump(dest: str | PathLike | IO, **kwargs) -> None
Parametrar
Den lokala sökvägen eller filströmmen som YAML-innehållet ska skrivas till. Om dest är en filsökväg skapas en ny fil. Om dest är en öppen fil skrivs filen till direkt.
- kwargs
- dict
Ytterligare argument som ska skickas till YAML-serialiseraren.
Undantag
Utlöses om dest är en filsökväg och filen redan finns.
Upphöjt om dest är en öppen fil och filen inte är skrivbar.
extend_search_space
Lägg till (a) sökutrymmen för det här AutoML NLP-jobbet.
extend_search_space(value: SearchSpace | List[SearchSpace]) -> None
Parametrar
- value
- Union[SearchSpace, List[SearchSpace]]
antingen ett SearchSpace-objekt eller en lista över SearchSpace-objekt med nlp-specifika parametrar.
Returer
Inga.
Undantag
Utlöses om dest är en filsökväg och filen redan finns.
Upphöjt om dest är en öppen fil och filen inte är skrivbar.
set_data
set_data(*, training_data: Input, target_column_name: str, validation_data: Input) -> None
Undantag
Utlöses om dest är en filsökväg och filen redan finns.
Upphöjt om dest är en öppen fil och filen inte är skrivbar.
set_featurization
set_featurization(*, dataset_language: str | None = None) -> None
Undantag
Utlöses om dest är en filsökväg och filen redan finns.
Upphöjt om dest är en öppen fil och filen inte är skrivbar.
set_limits
set_limits(*, max_trials: int = 1, max_concurrent_trials: int = 1, max_nodes: int = 1, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None
Undantag
Utlöses om dest är en filsökväg och filen redan finns.
Upphöjt om dest är en öppen fil och filen inte är skrivbar.
set_sweep
Svepinställningar för alla AutoML NLP-uppgifter.
set_sweep(*, sampling_algorithm: str | SamplingAlgorithmType, early_termination: EarlyTerminationPolicy | None = None)
Parametrar
- sampling_algorithm
Krävs. Anger typ av algoritm för hyperparametersampling. Möjliga värden är: "Grid", "Random" och "Bayesian".
- early_termination
Valfri princip för tidig uppsägning för att avsluta dåligt presterande utbildningskandidater.
Returer
Ingen
Undantag
Utlöses om dest är en filsökväg och filen redan finns.
Upphöjt om dest är en öppen fil och filen inte är skrivbar.
set_training_parameters
Åtgärda vissa träningsparametrar under hela träningsproceduren för alla kandidater.
Passera. Detta måste vara ett positivt heltal. :keyword learning_rate: inledande inlärningstakt. Måste vara en flottör i (0, 1). :keyword learning_rate_scheduler: typen av learning rate scheduler. Måste välja mellan "linjär", "cosiné", "cosine_with_restarts", "polynom", "konstant" och "constant_with_warmup". :keyword model_name: modellnamnet som ska användas under träningen. Måste välja mellan "bert-base-cased", "bert-base-uncased", "bert-base-multilingual-cased", "bert-base-german-cased", "bert-large-cased", "bert-large-uncased", "destilbert-base-cased", "destilbert-base-uncased", "roberta-base", "roberta-large", "destilroberta-base", "xlm-roberta-base", "xlm-roberta-large", xlnet-base-cased" och "xlnet-large-cased". :keyword number_of_epochs: antalet epoker att träna med. Måste vara ett positivt heltal. :keyword training_batch_size: batchstorleken under träningen. Måste vara ett positivt heltal. :keyword validation_batch_size: batchstorleken under valideringen. Måste vara ett positivt heltal. :keyword warmup_ratio: förhållandet mellan totalt antal träningssteg som används för en linjär uppvärmning från 0 till learning_rate. Måste vara en flotte i [0, 1]. :keyword weight_decay: värdet för viktförfall när optimizern är sgd, adam eller adamw. Detta måste vara ett flyttal i intervallet [0, 1]. :return: Ingen.
set_training_parameters(*, gradient_accumulation_steps: int | None = None, learning_rate: float | None = None, learning_rate_scheduler: str | NlpLearningRateScheduler | None = None, model_name: str | None = None, number_of_epochs: int | None = None, training_batch_size: int | None = None, validation_batch_size: int | None = None, warmup_ratio: float | None = None, weight_decay: float | None = None) -> None
Parametrar
- gradient_accumulation_steps
antal steg som toningar ska ackumuleras innan bakåt
Undantag
Utlöses om dest är en filsökväg och filen redan finns.
Upphöjt om dest är en öppen fil och filen inte är skrivbar.
Attribut
base_path
creation_context
featurization
id
Resurs-ID:t.
Returer
Resursens globala ID, ett ARM-ID (Azure Resource Manager).
Returtyp
inputs
limits
log_files
log_verbosity
outputs
primary_metric
search_space
status
Jobbets status.
Vanliga värden som returneras är "Running", "Completed" och "Failed". Alla möjliga värden är:
NotStarted – det här är ett tillfälligt tillstånd som körningsobjekt på klientsidan befinner sig i innan molnöverföringen.
Startar – Körningen har börjat bearbetas i molnet. Anroparen har nu ett körnings-ID.
Etablering – beräkning på begäran skapas för en viss jobböverföring.
Förbereder – Körningsmiljön förbereds och är i ett av två steg:
Docker-avbildningsversion
konfiguration av conda-miljö
I kö – jobbet köas på beräkningsmålet. I BatchAI är till exempel jobbet i ett köat tillstånd
i väntan på att alla begärda noder ska vara klara.
Körs – Jobbet har börjat köras på beräkningsmålet.
Slutför – Körningen av användarkod har slutförts och körningen är i efterbearbetningssteg.
CancelRequested – Annullering har begärts för jobbet.
Slutfört – körningen har slutförts. Detta omfattar både körning av användarkod och körning
efterbearbetningssteg.
Misslyckades – körningen misslyckades. Vanligtvis innehåller egenskapen Error på en körning information om varför.
Avbruten – följer en annulleringsbegäran och anger att körningen nu har avbrutits.
Svarar inte – inga pulsslag har skickats nyligen för körningar som har pulsslag aktiverade.
Returer
Jobbets status.
Returtyp
studio_url
sweep
task_type
Hämta aktivitetstyp.
Returer
Den typ av uppgift som ska köras. Möjliga värden är: "classification", "regression", "forecasting".
Returtyp
test_data
training_data
training_parameters
type
validation_data
Azure SDK for Python