TextClassificationJob Klass

Referens

Konfiguration för AutoML-textklassificeringsjobb.

Initierar en ny AutoML-textklassificeringsuppgift.

Arv: azure.ai.ml.entities._job.automl.nlp.automl_nlp_job.AutoMLNLPJob

TextClassificationJob

Konstruktor

TextClassificationJob(*, target_column_name: str | None = None, training_data: Input | None = None, validation_data: Input | None = None, primary_metric: ClassificationPrimaryMetrics | None = None, log_verbosity: str | None = None, **kwargs)

Parametrar

target_column_name

Obligatorisk

Namnet på målkolumnen

training_data

Obligatorisk

Träningsdata som ska användas för träning

validation_data

Obligatorisk

Valideringsdata som ska användas för att utvärdera den tränade modellen

primary_metric

Obligatorisk

Det primära måttet som ska visas

log_verbosity

Obligatorisk

Loggveroalitetsnivå

kwargs

Obligatorisk

Jobbspecifika argument

Metoder

dump	Dumpar jobbinnehållet till en fil i YAML-format.
extend_search_space	Lägg till (a) sökutrymmen för det här AutoML NLP-jobbet.
set_data
set_featurization
set_limits
set_sweep	Svepinställningar för alla AutoML NLP-uppgifter.
set_training_parameters	Åtgärda vissa träningsparametrar under hela träningsproceduren för alla kandidater. Passera. Detta måste vara ett positivt heltal. :keyword learning_rate: inledande inlärningstakt. Måste vara en flottör i (0, 1). :keyword learning_rate_scheduler: typen av learning rate scheduler. Måste välja mellan "linjär", "cosiné", "cosine_with_restarts", "polynom", "konstant" och "constant_with_warmup". :keyword model_name: modellnamnet som ska användas under träningen. Måste välja mellan "bert-base-cased", "bert-base-uncased", "bert-base-multilingual-cased", "bert-base-german-cased", "bert-large-cased", "bert-large-uncased", "destilbert-base-cased", "destilbert-base-uncased", "roberta-base", "roberta-large", "destilroberta-base", "xlm-roberta-base", "xlm-roberta-large", xlnet-base-cased" och "xlnet-large-cased". :keyword number_of_epochs: antalet epoker att träna med. Måste vara ett positivt heltal. :keyword training_batch_size: batchstorleken under träningen. Måste vara ett positivt heltal. :keyword validation_batch_size: batchstorleken under valideringen. Måste vara ett positivt heltal. :keyword warmup_ratio: förhållandet mellan totalt antal träningssteg som används för en linjär uppvärmning från 0 till learning_rate. Måste vara en flotte i [0, 1]. :keyword weight_decay: värdet för viktförfall när optimizern är sgd, adam eller adamw. Detta måste vara ett flyttal i intervallet [0, 1]. :return: Ingen.

dump

Dumpar jobbinnehållet till en fil i YAML-format.

dump(dest: str | PathLike | IO, **kwargs) -> None

Parametrar

dest: Union[<xref:PathLike>, str, IO[AnyStr]]

Obligatorisk

Den lokala sökvägen eller filströmmen som YAML-innehållet ska skrivas till. Om dest är en filsökväg skapas en ny fil. Om dest är en öppen fil skrivs filen till direkt.

kwargs: dict

Ytterligare argument som ska skickas till YAML-serialiseraren.

Undantag

FileExistsError

Utlöses om dest är en filsökväg och filen redan finns.

IOError

Upphöjt om dest är en öppen fil och filen inte är skrivbar.

extend_search_space

Lägg till (a) sökutrymmen för det här AutoML NLP-jobbet.

extend_search_space(value: SearchSpace | List[SearchSpace]) -> None

Parametrar

value: Union[SearchSpace, List[SearchSpace]]

Obligatorisk

antingen ett SearchSpace-objekt eller en lista över SearchSpace-objekt med nlp-specifika parametrar.

Returer

Inga.

Undantag

FileExistsError

Utlöses om dest är en filsökväg och filen redan finns.

IOError

Upphöjt om dest är en öppen fil och filen inte är skrivbar.

set_data

set_data(*, training_data: Input, target_column_name: str, validation_data: Input) -> None

Undantag

FileExistsError

Utlöses om dest är en filsökväg och filen redan finns.

IOError

Upphöjt om dest är en öppen fil och filen inte är skrivbar.

set_featurization

set_featurization(*, dataset_language: str | None = None) -> None

Undantag

FileExistsError

Utlöses om dest är en filsökväg och filen redan finns.

IOError

Upphöjt om dest är en öppen fil och filen inte är skrivbar.

set_limits

set_limits(*, max_trials: int = 1, max_concurrent_trials: int = 1, max_nodes: int = 1, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None

Undantag

FileExistsError

Utlöses om dest är en filsökväg och filen redan finns.

IOError

Upphöjt om dest är en öppen fil och filen inte är skrivbar.

set_sweep

Svepinställningar för alla AutoML NLP-uppgifter.

set_sweep(*, sampling_algorithm: str | SamplingAlgorithmType, early_termination: EarlyTerminationPolicy | None = None)

Parametrar

sampling_algorithm

Krävs. Anger typ av algoritm för hyperparametersampling. Möjliga värden är: "Grid", "Random" och "Bayesian".

early_termination

Valfri princip för tidig uppsägning för att avsluta dåligt presterande utbildningskandidater.

Returer

Ingen

Undantag

FileExistsError

Utlöses om dest är en filsökväg och filen redan finns.

IOError

Upphöjt om dest är en öppen fil och filen inte är skrivbar.

set_training_parameters

Åtgärda vissa träningsparametrar under hela träningsproceduren för alla kandidater.

Passera. Detta måste vara ett positivt heltal. :keyword learning_rate: inledande inlärningstakt. Måste vara en flottör i (0, 1). :keyword learning_rate_scheduler: typen av learning rate scheduler. Måste välja mellan "linjär", "cosiné", "cosine_with_restarts", "polynom", "konstant" och "constant_with_warmup". :keyword model_name: modellnamnet som ska användas under träningen. Måste välja mellan "bert-base-cased", "bert-base-uncased", "bert-base-multilingual-cased", "bert-base-german-cased", "bert-large-cased", "bert-large-uncased", "destilbert-base-cased", "destilbert-base-uncased", "roberta-base", "roberta-large", "destilroberta-base", "xlm-roberta-base", "xlm-roberta-large", xlnet-base-cased" och "xlnet-large-cased". :keyword number_of_epochs: antalet epoker att träna med. Måste vara ett positivt heltal. :keyword training_batch_size: batchstorleken under träningen. Måste vara ett positivt heltal. :keyword validation_batch_size: batchstorleken under valideringen. Måste vara ett positivt heltal. :keyword warmup_ratio: förhållandet mellan totalt antal träningssteg som används för en linjär uppvärmning från 0 till learning_rate. Måste vara en flotte i [0, 1]. :keyword weight_decay: värdet för viktförfall när optimizern är sgd, adam eller adamw. Detta måste vara ett flyttal i intervallet [0, 1]. :return: Ingen.

set_training_parameters(*, gradient_accumulation_steps: int | None = None, learning_rate: float | None = None, learning_rate_scheduler: str | NlpLearningRateScheduler | None = None, model_name: str | None = None, number_of_epochs: int | None = None, training_batch_size: int | None = None, validation_batch_size: int | None = None, warmup_ratio: float | None = None, weight_decay: float | None = None) -> None

Parametrar

gradient_accumulation_steps

antal steg som toningar ska ackumuleras innan bakåt

Undantag

FileExistsError

Utlöses om dest är en filsökväg och filen redan finns.

IOError

Upphöjt om dest är en öppen fil och filen inte är skrivbar.

Attribut

base_path

Resursens grundläggande sökväg.

Returer

Resursens grundläggande sökväg.

Returtyp

str

creation_context

Resursens skapandekontext.

Returer

Skapandemetadata för resursen.

Returtyp

Optional[SystemData]

featurization

id

Resurs-ID:t.

Returer

Resursens globala ID, ett ARM-ID (Azure Resource Manager).

Returtyp

Optional[str]

inputs

limits

log_files

Utdatafiler för jobb.

Returer

Ordlistan med loggnamn och URL:er.

Returtyp

Optional[Dict[str, str]]

log_verbosity

outputs

primary_metric

search_space

status

Jobbets status.

Vanliga värden som returneras är "Running", "Completed" och "Failed". Alla möjliga värden är:

NotStarted – det här är ett tillfälligt tillstånd som körningsobjekt på klientsidan befinner sig i innan molnöverföringen.
Startar – Körningen har börjat bearbetas i molnet. Anroparen har nu ett körnings-ID.
Etablering – beräkning på begäran skapas för en viss jobböverföring.
Förbereder – Körningsmiljön förbereds och är i ett av två steg:
- Docker-avbildningsversion
- konfiguration av conda-miljö
I kö – jobbet köas på beräkningsmålet. I BatchAI är till exempel jobbet i ett köat tillstånd

i väntan på att alla begärda noder ska vara klara.
Körs – Jobbet har börjat köras på beräkningsmålet.
Slutför – Körningen av användarkod har slutförts och körningen är i efterbearbetningssteg.
CancelRequested – Annullering har begärts för jobbet.
Slutfört – körningen har slutförts. Detta omfattar både körning av användarkod och körning

efterbearbetningssteg.
Misslyckades – körningen misslyckades. Vanligtvis innehåller egenskapen Error på en körning information om varför.
Avbruten – följer en annulleringsbegäran och anger att körningen nu har avbrutits.
Svarar inte – inga pulsslag har skickats nyligen för körningar som har pulsslag aktiverade.

Returer

Jobbets status.

Returtyp

Optional[str]

studio_url

Azure ML Studio-slutpunkt.

Returer

URL:en till jobbinformationssidan.

Returtyp

Optional[str]

sweep

task_type

Hämta aktivitetstyp.

Returer

Den typ av uppgift som ska köras. Möjliga värden är: "classification", "regression", "forecasting".

Returtyp

str

test_data

Hämta testdata.

Returer

Testa indata

Returtyp

Input

training_data

Hämta träningsdata.

Returer

Indata för träningsdata

Returtyp

Input

training_parameters

type

Jobbets typ.

Returer

Jobbets typ.

Returtyp

Optional[str]

validation_data

Hämta valideringsdata.

Returer

Indata för valideringsdata

Returtyp

Input

Dela via

TextClassificationJob Klass

Konstruktor

Parametrar

Metoder

dump

Parametrar

Undantag

extend_search_space

Parametrar

Returer

Undantag

set_data

Undantag

set_featurization

Undantag

set_limits

Undantag

set_sweep

Parametrar

Returer

Undantag

set_training_parameters

Parametrar

Undantag

Attribut

base_path

Returer

Returtyp

creation_context

Returer

Returtyp

featurization

id

Returer

Returtyp

inputs

limits

log_files

Returer

Returtyp

log_verbosity

outputs

primary_metric

search_space

status

Returer

Returtyp

studio_url

Returer

Returtyp

sweep

task_type

Returer

Returtyp

test_data

Returer

Returtyp

training_data

Returer

Returtyp

training_parameters

type

Returer

Returtyp

validation_data

Returer

Returtyp

Feedback

Ytterligare resurser