Dela via


TextNerJob Klass

Konfiguration för AutoML Text NER-jobb.

Initierar en ny AutoML Text NER-uppgift.

Arv
azure.ai.ml.entities._job.automl.nlp.automl_nlp_job.AutoMLNLPJob
TextNerJob

Konstruktor

TextNerJob(*, training_data: Input | None = None, validation_data: Input | None = None, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs)

Parametrar

training_data
Obligatorisk

Träningsdata som ska användas för träning

validation_data
Obligatorisk

Valideringsdata som ska användas för att utvärdera den tränade modellen

primary_metric
Obligatorisk

Det primära måttet som ska visas.

log_verbosity
Obligatorisk

Loggveroalitetsnivå

kwargs
Obligatorisk

Jobbspecifika argument

Metoder

dump

Dumpar jobbinnehållet till en fil i YAML-format.

extend_search_space

Lägg till (a) sökutrymmen för det här AutoML NLP-jobbet.

set_data
set_featurization
set_limits
set_sweep

Rensa inställningar för alla AutoML NLP-uppgifter.

set_training_parameters

Åtgärda vissa träningsparametrar under hela utbildningsproceduren för alla kandidater.

Passera. Detta måste vara ett positivt heltal. :keyword learning_rate: initial learning rate. Måste vara en flottör i (0, 1). :keyword learning_rate_scheduler: typen av learning rate scheduler. Måste välja mellan "linjär", "cosiné", "cosine_with_restarts", "polynom", "konstant" och "constant_with_warmup". :keyword model_name: modellnamnet som ska användas under träningen. Måste välja mellan "bert-base-cased", "bert-base-uncased", "bert-base-multilingual-cased", "bert-base-german-cased", "bert-large-cased", "bert-large-uncased", "destilbert-base-cased", "destilbert-base-uncased", "roberta-base", "roberta-large", "distilroberta-base", "xlm-roberta-base", "xlm-roberta-large", xlnet-base-cased" och "xlnet-large-cased". :keyword number_of_epochs: antalet epoker att träna med. Måste vara ett positivt heltal. :keyword training_batch_size: batchstorleken under träningen. Måste vara ett positivt heltal. :keyword validation_batch_size: batchstorleken under valideringen. Måste vara ett positivt heltal. :keyword warmup_ratio: ratio of total training steps used for a linear warmup from 0 to learning_rate. Måste vara en flottör i [0, 1]. :keyword weight_decay: value of weight decay when optimizer is sgd, adam, or adamw. Detta måste vara en flottör i intervallet [0, 1]. :return: Ingen.

dump

Dumpar jobbinnehållet till en fil i YAML-format.

dump(dest: str | PathLike | IO, **kwargs) -> None

Parametrar

dest
Union[<xref:PathLike>, str, IO[AnyStr]]
Obligatorisk

Den lokala sökvägen eller filströmmen som YAML-innehållet ska skrivas till. Om dest är en filsökväg skapas en ny fil. Om dest är en öppen fil skrivs filen till direkt.

kwargs
dict

Ytterligare argument som ska skickas till YAML-serialiseraren.

Undantag

Upphöjt om dest är en filsökväg och filen redan finns.

Upphöjt om dest är en öppen fil och filen inte kan skrivas.

extend_search_space

Lägg till (a) sökutrymmen för det här AutoML NLP-jobbet.

extend_search_space(value: SearchSpace | List[SearchSpace]) -> None

Parametrar

value
Union[SearchSpace, List[SearchSpace]]
Obligatorisk

antingen ett SearchSpace-objekt eller en lista över SearchSpace-objekt med nlp-specifika parametrar.

Returer

Inga.

Undantag

Upphöjt om dest är en filsökväg och filen redan finns.

Upphöjt om dest är en öppen fil och filen inte kan skrivas.

set_data

set_data(*, training_data: Input, target_column_name: str, validation_data: Input) -> None

Undantag

Upphöjt om dest är en filsökväg och filen redan finns.

Upphöjt om dest är en öppen fil och filen inte kan skrivas.

set_featurization

set_featurization(*, dataset_language: str | None = None) -> None

Undantag

Upphöjt om dest är en filsökväg och filen redan finns.

Upphöjt om dest är en öppen fil och filen inte kan skrivas.

set_limits

set_limits(*, max_trials: int = 1, max_concurrent_trials: int = 1, max_nodes: int = 1, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None

Undantag

Upphöjt om dest är en filsökväg och filen redan finns.

Upphöjt om dest är en öppen fil och filen inte kan skrivas.

set_sweep

Rensa inställningar för alla AutoML NLP-uppgifter.

set_sweep(*, sampling_algorithm: str | SamplingAlgorithmType, early_termination: EarlyTerminationPolicy | None = None)

Parametrar

sampling_algorithm

Krävs. Anger typ av hyperparametersamplingsalgoritm. Möjliga värden är: "Grid", "Random" och "Bayesian".

early_termination

Valfri policy för tidig uppsägning för att få slut på dåligt presterande utbildningskandidater.

Returer

Ingen

Undantag

Upphöjt om dest är en filsökväg och filen redan finns.

Upphöjt om dest är en öppen fil och filen inte kan skrivas.

set_training_parameters

Åtgärda vissa träningsparametrar under hela utbildningsproceduren för alla kandidater.

Passera. Detta måste vara ett positivt heltal. :keyword learning_rate: initial learning rate. Måste vara en flottör i (0, 1). :keyword learning_rate_scheduler: typen av learning rate scheduler. Måste välja mellan "linjär", "cosiné", "cosine_with_restarts", "polynom", "konstant" och "constant_with_warmup". :keyword model_name: modellnamnet som ska användas under träningen. Måste välja mellan "bert-base-cased", "bert-base-uncased", "bert-base-multilingual-cased", "bert-base-german-cased", "bert-large-cased", "bert-large-uncased", "destilbert-base-cased", "destilbert-base-uncased", "roberta-base", "roberta-large", "distilroberta-base", "xlm-roberta-base", "xlm-roberta-large", xlnet-base-cased" och "xlnet-large-cased". :keyword number_of_epochs: antalet epoker att träna med. Måste vara ett positivt heltal. :keyword training_batch_size: batchstorleken under träningen. Måste vara ett positivt heltal. :keyword validation_batch_size: batchstorleken under valideringen. Måste vara ett positivt heltal. :keyword warmup_ratio: ratio of total training steps used for a linear warmup from 0 to learning_rate. Måste vara en flottör i [0, 1]. :keyword weight_decay: value of weight decay when optimizer is sgd, adam, or adamw. Detta måste vara en flottör i intervallet [0, 1]. :return: Ingen.

set_training_parameters(*, gradient_accumulation_steps: int | None = None, learning_rate: float | None = None, learning_rate_scheduler: str | NlpLearningRateScheduler | None = None, model_name: str | None = None, number_of_epochs: int | None = None, training_batch_size: int | None = None, validation_batch_size: int | None = None, warmup_ratio: float | None = None, weight_decay: float | None = None) -> None

Parametrar

gradient_accumulation_steps

antal steg som toningar ska ackumuleras före en bakåt

Undantag

Upphöjt om dest är en filsökväg och filen redan finns.

Upphöjt om dest är en öppen fil och filen inte kan skrivas.

Attribut

base_path

Resursens grundläggande sökväg.

Returer

Resursens grundläggande sökväg.

Returtyp

str

creation_context

Resursens skapandekontext.

Returer

Skapandemetadata för resursen.

Returtyp

featurization

id

Resurs-ID:t.

Returer

Resursens globala ID, ett ARM-ID (Azure Resource Manager).

Returtyp

inputs

limits

log_files

Jobbutdatafiler.

Returer

Ordlistan med loggnamn och URL:er.

Returtyp

log_verbosity

outputs

primary_metric

search_space

status

Jobbets status.

Vanliga värden som returneras är "Running", "Completed" och "Failed". Alla möjliga värden är:

  • NotStarted – det här är ett tillfälligt tillstånd som körningsobjekt på klientsidan befinner sig i innan molnöverföringen.

  • Start – Körningen har börjat bearbetas i molnet. Anroparen har ett körnings-ID just nu.

  • Etablering – beräkning på begäran skapas för en viss jobböverföring.

  • Förbereder – Körningsmiljön förbereds och är i ett av två steg:

    • Docker-avbildningsversion

    • konfiguration av conda-miljö

  • I kö – Jobbet placeras i kö på beräkningsmålet. I BatchAI är jobbet till exempel i ett köat tillstånd

    medan du väntar på att alla begärda noder ska vara klara.

  • Körs – Jobbet har börjat köras på beräkningsmålet.

  • Slutför – Körningen av användarkod har slutförts och körningen är i efterbearbetningssteg.

  • CancelRequested – Annullering har begärts för jobbet.

  • Slutförd – körningen har slutförts. Detta omfattar både körning och körning av användarkod

    efterbearbetningssteg.

  • Misslyckades – körningen misslyckades. Vanligtvis innehåller egenskapen Error på en körning information om varför.

  • Avbryts – följer en begäran om annullering och anger att körningen nu har avbrutits.

  • Svarar inte – För körningar som har Pulsslag aktiverat har inga pulsslag nyligen skickats.

Returer

Status för jobbet.

Returtyp

studio_url

Azure ML Studio-slutpunkt.

Returer

URL:en till jobbinformationssidan.

Returtyp

sweep

task_type

Hämta aktivitetstyp.

Returer

Den typ av uppgift som ska köras. Möjliga värden är: "classification", "regression", "forecasting".

Returtyp

str

test_data

Hämta testdata.

Returer

Testa indata

Returtyp

training_data

Hämta träningsdata.

Returer

Indata för träningsdata

Returtyp

training_parameters

type

Typen av jobb.

Returer

Typen av jobb.

Returtyp

validation_data

Hämta valideringsdata.

Returer

Indata för valideringsdata

Returtyp