Dela via


TextClassificationJob Klass

Konfiguration för AutoML-textklassificeringsjobb.

Initierar en ny AutoML-textklassificeringsuppgift.

Arv
azure.ai.ml.entities._job.automl.nlp.automl_nlp_job.AutoMLNLPJob
TextClassificationJob

Konstruktor

TextClassificationJob(*, target_column_name: str | None = None, training_data: Input | None = None, validation_data: Input | None = None, primary_metric: ClassificationPrimaryMetrics | None = None, log_verbosity: str | None = None, **kwargs)

Parametrar

target_column_name
Obligatorisk

Namnet på målkolumnen

training_data
Obligatorisk

Träningsdata som ska användas för träning

validation_data
Obligatorisk

Valideringsdata som ska användas för att utvärdera den tränade modellen

primary_metric
Obligatorisk

Det primära måttet som ska visas

log_verbosity
Obligatorisk

Loggveroalitetsnivå

kwargs
Obligatorisk

Jobbspecifika argument

Metoder

dump

Dumpar jobbinnehållet till en fil i YAML-format.

extend_search_space

Lägg till (a) sökutrymmen för det här AutoML NLP-jobbet.

set_data
set_featurization
set_limits
set_sweep

Svepinställningar för alla AutoML NLP-uppgifter.

set_training_parameters

Åtgärda vissa träningsparametrar under hela träningsproceduren för alla kandidater.

Passera. Detta måste vara ett positivt heltal. :keyword learning_rate: inledande inlärningstakt. Måste vara en flottör i (0, 1). :keyword learning_rate_scheduler: typen av learning rate scheduler. Måste välja mellan "linjär", "cosiné", "cosine_with_restarts", "polynom", "konstant" och "constant_with_warmup". :keyword model_name: modellnamnet som ska användas under träningen. Måste välja mellan "bert-base-cased", "bert-base-uncased", "bert-base-multilingual-cased", "bert-base-german-cased", "bert-large-cased", "bert-large-uncased", "destilbert-base-cased", "destilbert-base-uncased", "roberta-base", "roberta-large", "destilroberta-base", "xlm-roberta-base", "xlm-roberta-large", xlnet-base-cased" och "xlnet-large-cased". :keyword number_of_epochs: antalet epoker att träna med. Måste vara ett positivt heltal. :keyword training_batch_size: batchstorleken under träningen. Måste vara ett positivt heltal. :keyword validation_batch_size: batchstorleken under valideringen. Måste vara ett positivt heltal. :keyword warmup_ratio: förhållandet mellan totalt antal träningssteg som används för en linjär uppvärmning från 0 till learning_rate. Måste vara en flotte i [0, 1]. :keyword weight_decay: värdet för viktförfall när optimizern är sgd, adam eller adamw. Detta måste vara ett flyttal i intervallet [0, 1]. :return: Ingen.

dump

Dumpar jobbinnehållet till en fil i YAML-format.

dump(dest: str | PathLike | IO, **kwargs) -> None

Parametrar

dest
Union[<xref:PathLike>, str, IO[AnyStr]]
Obligatorisk

Den lokala sökvägen eller filströmmen som YAML-innehållet ska skrivas till. Om dest är en filsökväg skapas en ny fil. Om dest är en öppen fil skrivs filen till direkt.

kwargs
dict

Ytterligare argument som ska skickas till YAML-serialiseraren.

Undantag

Utlöses om dest är en filsökväg och filen redan finns.

Upphöjt om dest är en öppen fil och filen inte är skrivbar.

extend_search_space

Lägg till (a) sökutrymmen för det här AutoML NLP-jobbet.

extend_search_space(value: SearchSpace | List[SearchSpace]) -> None

Parametrar

value
Union[SearchSpace, List[SearchSpace]]
Obligatorisk

antingen ett SearchSpace-objekt eller en lista över SearchSpace-objekt med nlp-specifika parametrar.

Returer

Inga.

Undantag

Utlöses om dest är en filsökväg och filen redan finns.

Upphöjt om dest är en öppen fil och filen inte är skrivbar.

set_data

set_data(*, training_data: Input, target_column_name: str, validation_data: Input) -> None

Undantag

Utlöses om dest är en filsökväg och filen redan finns.

Upphöjt om dest är en öppen fil och filen inte är skrivbar.

set_featurization

set_featurization(*, dataset_language: str | None = None) -> None

Undantag

Utlöses om dest är en filsökväg och filen redan finns.

Upphöjt om dest är en öppen fil och filen inte är skrivbar.

set_limits

set_limits(*, max_trials: int = 1, max_concurrent_trials: int = 1, max_nodes: int = 1, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None

Undantag

Utlöses om dest är en filsökväg och filen redan finns.

Upphöjt om dest är en öppen fil och filen inte är skrivbar.

set_sweep

Svepinställningar för alla AutoML NLP-uppgifter.

set_sweep(*, sampling_algorithm: str | SamplingAlgorithmType, early_termination: EarlyTerminationPolicy | None = None)

Parametrar

sampling_algorithm

Krävs. Anger typ av algoritm för hyperparametersampling. Möjliga värden är: "Grid", "Random" och "Bayesian".

early_termination

Valfri princip för tidig uppsägning för att avsluta dåligt presterande utbildningskandidater.

Returer

Ingen

Undantag

Utlöses om dest är en filsökväg och filen redan finns.

Upphöjt om dest är en öppen fil och filen inte är skrivbar.

set_training_parameters

Åtgärda vissa träningsparametrar under hela träningsproceduren för alla kandidater.

Passera. Detta måste vara ett positivt heltal. :keyword learning_rate: inledande inlärningstakt. Måste vara en flottör i (0, 1). :keyword learning_rate_scheduler: typen av learning rate scheduler. Måste välja mellan "linjär", "cosiné", "cosine_with_restarts", "polynom", "konstant" och "constant_with_warmup". :keyword model_name: modellnamnet som ska användas under träningen. Måste välja mellan "bert-base-cased", "bert-base-uncased", "bert-base-multilingual-cased", "bert-base-german-cased", "bert-large-cased", "bert-large-uncased", "destilbert-base-cased", "destilbert-base-uncased", "roberta-base", "roberta-large", "destilroberta-base", "xlm-roberta-base", "xlm-roberta-large", xlnet-base-cased" och "xlnet-large-cased". :keyword number_of_epochs: antalet epoker att träna med. Måste vara ett positivt heltal. :keyword training_batch_size: batchstorleken under träningen. Måste vara ett positivt heltal. :keyword validation_batch_size: batchstorleken under valideringen. Måste vara ett positivt heltal. :keyword warmup_ratio: förhållandet mellan totalt antal träningssteg som används för en linjär uppvärmning från 0 till learning_rate. Måste vara en flotte i [0, 1]. :keyword weight_decay: värdet för viktförfall när optimizern är sgd, adam eller adamw. Detta måste vara ett flyttal i intervallet [0, 1]. :return: Ingen.

set_training_parameters(*, gradient_accumulation_steps: int | None = None, learning_rate: float | None = None, learning_rate_scheduler: str | NlpLearningRateScheduler | None = None, model_name: str | None = None, number_of_epochs: int | None = None, training_batch_size: int | None = None, validation_batch_size: int | None = None, warmup_ratio: float | None = None, weight_decay: float | None = None) -> None

Parametrar

gradient_accumulation_steps

antal steg som toningar ska ackumuleras innan bakåt

Undantag

Utlöses om dest är en filsökväg och filen redan finns.

Upphöjt om dest är en öppen fil och filen inte är skrivbar.

Attribut

base_path

Resursens grundläggande sökväg.

Returer

Resursens grundläggande sökväg.

Returtyp

str

creation_context

Resursens skapandekontext.

Returer

Skapandemetadata för resursen.

Returtyp

featurization

id

Resurs-ID:t.

Returer

Resursens globala ID, ett ARM-ID (Azure Resource Manager).

Returtyp

inputs

limits

log_files

Utdatafiler för jobb.

Returer

Ordlistan med loggnamn och URL:er.

Returtyp

log_verbosity

outputs

primary_metric

search_space

status

Jobbets status.

Vanliga värden som returneras är "Running", "Completed" och "Failed". Alla möjliga värden är:

  • NotStarted – det här är ett tillfälligt tillstånd som körningsobjekt på klientsidan befinner sig i innan molnöverföringen.

  • Startar – Körningen har börjat bearbetas i molnet. Anroparen har nu ett körnings-ID.

  • Etablering – beräkning på begäran skapas för en viss jobböverföring.

  • Förbereder – Körningsmiljön förbereds och är i ett av två steg:

    • Docker-avbildningsversion

    • konfiguration av conda-miljö

  • I kö – jobbet köas på beräkningsmålet. I BatchAI är till exempel jobbet i ett köat tillstånd

    i väntan på att alla begärda noder ska vara klara.

  • Körs – Jobbet har börjat köras på beräkningsmålet.

  • Slutför – Körningen av användarkod har slutförts och körningen är i efterbearbetningssteg.

  • CancelRequested – Annullering har begärts för jobbet.

  • Slutfört – körningen har slutförts. Detta omfattar både körning av användarkod och körning

    efterbearbetningssteg.

  • Misslyckades – körningen misslyckades. Vanligtvis innehåller egenskapen Error på en körning information om varför.

  • Avbruten – följer en annulleringsbegäran och anger att körningen nu har avbrutits.

  • Svarar inte – inga pulsslag har skickats nyligen för körningar som har pulsslag aktiverade.

Returer

Jobbets status.

Returtyp

studio_url

Azure ML Studio-slutpunkt.

Returer

URL:en till jobbinformationssidan.

Returtyp

sweep

task_type

Hämta aktivitetstyp.

Returer

Den typ av uppgift som ska köras. Möjliga värden är: "classification", "regression", "forecasting".

Returtyp

str

test_data

Hämta testdata.

Returer

Testa indata

Returtyp

training_data

Hämta träningsdata.

Returer

Indata för träningsdata

Returtyp

training_parameters

type

Jobbets typ.

Returer

Jobbets typ.

Returtyp

validation_data

Hämta valideringsdata.

Returer

Indata för valideringsdata

Returtyp