TextNerJob Klass

Referens

Konfiguration för AutoML Text NER-jobb.

Initierar en ny AutoML Text NER-uppgift.

Arv: azure.ai.ml.entities._job.automl.nlp.automl_nlp_job.AutoMLNLPJob

TextNerJob

Konstruktor

TextNerJob(*, training_data: Input | None = None, validation_data: Input | None = None, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs)

Parametrar

training_data

Obligatorisk

Träningsdata som ska användas för träning

validation_data

Obligatorisk

Valideringsdata som ska användas för att utvärdera den tränade modellen

primary_metric

Obligatorisk

Det primära måttet som ska visas.

log_verbosity

Obligatorisk

Loggveroalitetsnivå

kwargs

Obligatorisk

Jobbspecifika argument

Metoder

dump	Dumpar jobbinnehållet till en fil i YAML-format.
extend_search_space	Lägg till (a) sökutrymmen för det här AutoML NLP-jobbet.
set_data
set_featurization
set_limits
set_sweep	Rensa inställningar för alla AutoML NLP-uppgifter.
set_training_parameters	Åtgärda vissa träningsparametrar under hela utbildningsproceduren för alla kandidater. Passera. Detta måste vara ett positivt heltal. :keyword learning_rate: initial learning rate. Måste vara en flottör i (0, 1). :keyword learning_rate_scheduler: typen av learning rate scheduler. Måste välja mellan "linjär", "cosiné", "cosine_with_restarts", "polynom", "konstant" och "constant_with_warmup". :keyword model_name: modellnamnet som ska användas under träningen. Måste välja mellan "bert-base-cased", "bert-base-uncased", "bert-base-multilingual-cased", "bert-base-german-cased", "bert-large-cased", "bert-large-uncased", "destilbert-base-cased", "destilbert-base-uncased", "roberta-base", "roberta-large", "distilroberta-base", "xlm-roberta-base", "xlm-roberta-large", xlnet-base-cased" och "xlnet-large-cased". :keyword number_of_epochs: antalet epoker att träna med. Måste vara ett positivt heltal. :keyword training_batch_size: batchstorleken under träningen. Måste vara ett positivt heltal. :keyword validation_batch_size: batchstorleken under valideringen. Måste vara ett positivt heltal. :keyword warmup_ratio: ratio of total training steps used for a linear warmup from 0 to learning_rate. Måste vara en flottör i [0, 1]. :keyword weight_decay: value of weight decay when optimizer is sgd, adam, or adamw. Detta måste vara en flottör i intervallet [0, 1]. :return: Ingen.

dump

Dumpar jobbinnehållet till en fil i YAML-format.

dump(dest: str | PathLike | IO, **kwargs) -> None

Parametrar

dest: Union[<xref:PathLike>, str, IO[AnyStr]]

Obligatorisk

Den lokala sökvägen eller filströmmen som YAML-innehållet ska skrivas till. Om dest är en filsökväg skapas en ny fil. Om dest är en öppen fil skrivs filen till direkt.

kwargs: dict

Ytterligare argument som ska skickas till YAML-serialiseraren.

Undantag

FileExistsError

Upphöjt om dest är en filsökväg och filen redan finns.

IOError

Upphöjt om dest är en öppen fil och filen inte kan skrivas.

extend_search_space

Lägg till (a) sökutrymmen för det här AutoML NLP-jobbet.

extend_search_space(value: SearchSpace | List[SearchSpace]) -> None

Parametrar

value: Union[SearchSpace, List[SearchSpace]]

Obligatorisk

antingen ett SearchSpace-objekt eller en lista över SearchSpace-objekt med nlp-specifika parametrar.

Returer

Inga.

Undantag

FileExistsError

Upphöjt om dest är en filsökväg och filen redan finns.

IOError

Upphöjt om dest är en öppen fil och filen inte kan skrivas.

set_data

set_data(*, training_data: Input, target_column_name: str, validation_data: Input) -> None

Undantag

FileExistsError

Upphöjt om dest är en filsökväg och filen redan finns.

IOError

Upphöjt om dest är en öppen fil och filen inte kan skrivas.

set_featurization

set_featurization(*, dataset_language: str | None = None) -> None

Undantag

FileExistsError

Upphöjt om dest är en filsökväg och filen redan finns.

IOError

Upphöjt om dest är en öppen fil och filen inte kan skrivas.

set_limits

set_limits(*, max_trials: int = 1, max_concurrent_trials: int = 1, max_nodes: int = 1, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None

Undantag

FileExistsError

Upphöjt om dest är en filsökväg och filen redan finns.

IOError

Upphöjt om dest är en öppen fil och filen inte kan skrivas.

set_sweep

Rensa inställningar för alla AutoML NLP-uppgifter.

set_sweep(*, sampling_algorithm: str | SamplingAlgorithmType, early_termination: EarlyTerminationPolicy | None = None)

Parametrar

sampling_algorithm

Krävs. Anger typ av hyperparametersamplingsalgoritm. Möjliga värden är: "Grid", "Random" och "Bayesian".

early_termination

Valfri policy för tidig uppsägning för att få slut på dåligt presterande utbildningskandidater.

Returer

Ingen

Undantag

FileExistsError

Upphöjt om dest är en filsökväg och filen redan finns.

IOError

Upphöjt om dest är en öppen fil och filen inte kan skrivas.

set_training_parameters

Åtgärda vissa träningsparametrar under hela utbildningsproceduren för alla kandidater.

Passera. Detta måste vara ett positivt heltal. :keyword learning_rate: initial learning rate. Måste vara en flottör i (0, 1). :keyword learning_rate_scheduler: typen av learning rate scheduler. Måste välja mellan "linjär", "cosiné", "cosine_with_restarts", "polynom", "konstant" och "constant_with_warmup". :keyword model_name: modellnamnet som ska användas under träningen. Måste välja mellan "bert-base-cased", "bert-base-uncased", "bert-base-multilingual-cased", "bert-base-german-cased", "bert-large-cased", "bert-large-uncased", "destilbert-base-cased", "destilbert-base-uncased", "roberta-base", "roberta-large", "distilroberta-base", "xlm-roberta-base", "xlm-roberta-large", xlnet-base-cased" och "xlnet-large-cased". :keyword number_of_epochs: antalet epoker att träna med. Måste vara ett positivt heltal. :keyword training_batch_size: batchstorleken under träningen. Måste vara ett positivt heltal. :keyword validation_batch_size: batchstorleken under valideringen. Måste vara ett positivt heltal. :keyword warmup_ratio: ratio of total training steps used for a linear warmup from 0 to learning_rate. Måste vara en flottör i [0, 1]. :keyword weight_decay: value of weight decay when optimizer is sgd, adam, or adamw. Detta måste vara en flottör i intervallet [0, 1]. :return: Ingen.

set_training_parameters(*, gradient_accumulation_steps: int | None = None, learning_rate: float | None = None, learning_rate_scheduler: str | NlpLearningRateScheduler | None = None, model_name: str | None = None, number_of_epochs: int | None = None, training_batch_size: int | None = None, validation_batch_size: int | None = None, warmup_ratio: float | None = None, weight_decay: float | None = None) -> None

Parametrar

gradient_accumulation_steps

antal steg som toningar ska ackumuleras före en bakåt

Undantag

FileExistsError

Upphöjt om dest är en filsökväg och filen redan finns.

IOError

Upphöjt om dest är en öppen fil och filen inte kan skrivas.

Attribut

base_path

Resursens grundläggande sökväg.

Returer

Resursens grundläggande sökväg.

Returtyp

str

creation_context

Resursens skapandekontext.

Returer

Skapandemetadata för resursen.

Returtyp

Optional[SystemData]

featurization

id

Resurs-ID:t.

Returer

Resursens globala ID, ett ARM-ID (Azure Resource Manager).

Returtyp

Optional[str]

inputs

limits

log_files

Jobbutdatafiler.

Returer

Ordlistan med loggnamn och URL:er.

Returtyp

Optional[Dict[str, str]]

log_verbosity

outputs

primary_metric

search_space

status

Jobbets status.

Vanliga värden som returneras är "Running", "Completed" och "Failed". Alla möjliga värden är:

NotStarted – det här är ett tillfälligt tillstånd som körningsobjekt på klientsidan befinner sig i innan molnöverföringen.
Start – Körningen har börjat bearbetas i molnet. Anroparen har ett körnings-ID just nu.
Etablering – beräkning på begäran skapas för en viss jobböverföring.
Förbereder – Körningsmiljön förbereds och är i ett av två steg:
- Docker-avbildningsversion
- konfiguration av conda-miljö
I kö – Jobbet placeras i kö på beräkningsmålet. I BatchAI är jobbet till exempel i ett köat tillstånd

medan du väntar på att alla begärda noder ska vara klara.
Körs – Jobbet har börjat köras på beräkningsmålet.
Slutför – Körningen av användarkod har slutförts och körningen är i efterbearbetningssteg.
CancelRequested – Annullering har begärts för jobbet.
Slutförd – körningen har slutförts. Detta omfattar både körning och körning av användarkod

efterbearbetningssteg.
Misslyckades – körningen misslyckades. Vanligtvis innehåller egenskapen Error på en körning information om varför.
Avbryts – följer en begäran om annullering och anger att körningen nu har avbrutits.
Svarar inte – För körningar som har Pulsslag aktiverat har inga pulsslag nyligen skickats.

Returer

Status för jobbet.

Returtyp

Optional[str]

studio_url

Azure ML Studio-slutpunkt.

Returer

URL:en till jobbinformationssidan.

Returtyp

Optional[str]

sweep

task_type

Hämta aktivitetstyp.

Returer

Den typ av uppgift som ska köras. Möjliga värden är: "classification", "regression", "forecasting".

Returtyp

str

test_data

Hämta testdata.

Returer

Testa indata

Returtyp

Input

training_data

Hämta träningsdata.

Returer

Indata för träningsdata

Returtyp

Input

training_parameters

type

Typen av jobb.

Returer

Typen av jobb.

Returtyp

Optional[str]

validation_data

Hämta valideringsdata.

Returer

Indata för valideringsdata

Returtyp

Input

Dela via

TextNerJob Klass

Konstruktor

Parametrar

Metoder

dump

Parametrar

Undantag

extend_search_space

Parametrar

Returer

Undantag

set_data

Undantag

set_featurization

Undantag

set_limits

Undantag

set_sweep

Parametrar

Returer

Undantag

set_training_parameters

Parametrar

Undantag

Attribut

base_path

Returer

Returtyp

creation_context

Returer

Returtyp

featurization

id

Returer

Returtyp

inputs

limits

log_files

Returer

Returtyp

log_verbosity

outputs

primary_metric

search_space

status

Returer

Returtyp

studio_url

Returer

Returtyp

sweep

task_type

Returer

Returtyp

test_data

Returer

Returtyp

training_data

Returer

Returtyp

training_parameters

type

Returer

Returtyp

validation_data

Returer

Returtyp

Ytterligare resurser