TextNerJob Klass
Konfiguration för AutoML Text NER-jobb.
Initierar en ny AutoML Text NER-uppgift.
- Arv
-
azure.ai.ml.entities._job.automl.nlp.automl_nlp_job.AutoMLNLPJobTextNerJob
Konstruktor
TextNerJob(*, training_data: Input | None = None, validation_data: Input | None = None, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs)
Parametrar
- training_data
Träningsdata som ska användas för träning
- validation_data
Valideringsdata som ska användas för att utvärdera den tränade modellen
- primary_metric
Det primära måttet som ska visas.
- log_verbosity
Loggveroalitetsnivå
- kwargs
Jobbspecifika argument
Metoder
dump |
Dumpar jobbinnehållet till en fil i YAML-format. |
extend_search_space |
Lägg till (a) sökutrymmen för det här AutoML NLP-jobbet. |
set_data | |
set_featurization | |
set_limits | |
set_sweep |
Rensa inställningar för alla AutoML NLP-uppgifter. |
set_training_parameters |
Åtgärda vissa träningsparametrar under hela utbildningsproceduren för alla kandidater. Passera. Detta måste vara ett positivt heltal. :keyword learning_rate: initial learning rate. Måste vara en flottör i (0, 1). :keyword learning_rate_scheduler: typen av learning rate scheduler. Måste välja mellan "linjär", "cosiné", "cosine_with_restarts", "polynom", "konstant" och "constant_with_warmup". :keyword model_name: modellnamnet som ska användas under träningen. Måste välja mellan "bert-base-cased", "bert-base-uncased", "bert-base-multilingual-cased", "bert-base-german-cased", "bert-large-cased", "bert-large-uncased", "destilbert-base-cased", "destilbert-base-uncased", "roberta-base", "roberta-large", "distilroberta-base", "xlm-roberta-base", "xlm-roberta-large", xlnet-base-cased" och "xlnet-large-cased". :keyword number_of_epochs: antalet epoker att träna med. Måste vara ett positivt heltal. :keyword training_batch_size: batchstorleken under träningen. Måste vara ett positivt heltal. :keyword validation_batch_size: batchstorleken under valideringen. Måste vara ett positivt heltal. :keyword warmup_ratio: ratio of total training steps used for a linear warmup from 0 to learning_rate. Måste vara en flottör i [0, 1]. :keyword weight_decay: value of weight decay when optimizer is sgd, adam, or adamw. Detta måste vara en flottör i intervallet [0, 1]. :return: Ingen. |
dump
Dumpar jobbinnehållet till en fil i YAML-format.
dump(dest: str | PathLike | IO, **kwargs) -> None
Parametrar
Den lokala sökvägen eller filströmmen som YAML-innehållet ska skrivas till. Om dest är en filsökväg skapas en ny fil. Om dest är en öppen fil skrivs filen till direkt.
- kwargs
- dict
Ytterligare argument som ska skickas till YAML-serialiseraren.
Undantag
Upphöjt om dest är en filsökväg och filen redan finns.
Upphöjt om dest är en öppen fil och filen inte kan skrivas.
extend_search_space
Lägg till (a) sökutrymmen för det här AutoML NLP-jobbet.
extend_search_space(value: SearchSpace | List[SearchSpace]) -> None
Parametrar
- value
- Union[SearchSpace, List[SearchSpace]]
antingen ett SearchSpace-objekt eller en lista över SearchSpace-objekt med nlp-specifika parametrar.
Returer
Inga.
Undantag
Upphöjt om dest är en filsökväg och filen redan finns.
Upphöjt om dest är en öppen fil och filen inte kan skrivas.
set_data
set_data(*, training_data: Input, target_column_name: str, validation_data: Input) -> None
Undantag
Upphöjt om dest är en filsökväg och filen redan finns.
Upphöjt om dest är en öppen fil och filen inte kan skrivas.
set_featurization
set_featurization(*, dataset_language: str | None = None) -> None
Undantag
Upphöjt om dest är en filsökväg och filen redan finns.
Upphöjt om dest är en öppen fil och filen inte kan skrivas.
set_limits
set_limits(*, max_trials: int = 1, max_concurrent_trials: int = 1, max_nodes: int = 1, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None
Undantag
Upphöjt om dest är en filsökväg och filen redan finns.
Upphöjt om dest är en öppen fil och filen inte kan skrivas.
set_sweep
Rensa inställningar för alla AutoML NLP-uppgifter.
set_sweep(*, sampling_algorithm: str | SamplingAlgorithmType, early_termination: EarlyTerminationPolicy | None = None)
Parametrar
- sampling_algorithm
Krävs. Anger typ av hyperparametersamplingsalgoritm. Möjliga värden är: "Grid", "Random" och "Bayesian".
- early_termination
Valfri policy för tidig uppsägning för att få slut på dåligt presterande utbildningskandidater.
Returer
Ingen
Undantag
Upphöjt om dest är en filsökväg och filen redan finns.
Upphöjt om dest är en öppen fil och filen inte kan skrivas.
set_training_parameters
Åtgärda vissa träningsparametrar under hela utbildningsproceduren för alla kandidater.
Passera. Detta måste vara ett positivt heltal. :keyword learning_rate: initial learning rate. Måste vara en flottör i (0, 1). :keyword learning_rate_scheduler: typen av learning rate scheduler. Måste välja mellan "linjär", "cosiné", "cosine_with_restarts", "polynom", "konstant" och "constant_with_warmup". :keyword model_name: modellnamnet som ska användas under träningen. Måste välja mellan "bert-base-cased", "bert-base-uncased", "bert-base-multilingual-cased", "bert-base-german-cased", "bert-large-cased", "bert-large-uncased", "destilbert-base-cased", "destilbert-base-uncased", "roberta-base", "roberta-large", "distilroberta-base", "xlm-roberta-base", "xlm-roberta-large", xlnet-base-cased" och "xlnet-large-cased". :keyword number_of_epochs: antalet epoker att träna med. Måste vara ett positivt heltal. :keyword training_batch_size: batchstorleken under träningen. Måste vara ett positivt heltal. :keyword validation_batch_size: batchstorleken under valideringen. Måste vara ett positivt heltal. :keyword warmup_ratio: ratio of total training steps used for a linear warmup from 0 to learning_rate. Måste vara en flottör i [0, 1]. :keyword weight_decay: value of weight decay when optimizer is sgd, adam, or adamw. Detta måste vara en flottör i intervallet [0, 1]. :return: Ingen.
set_training_parameters(*, gradient_accumulation_steps: int | None = None, learning_rate: float | None = None, learning_rate_scheduler: str | NlpLearningRateScheduler | None = None, model_name: str | None = None, number_of_epochs: int | None = None, training_batch_size: int | None = None, validation_batch_size: int | None = None, warmup_ratio: float | None = None, weight_decay: float | None = None) -> None
Parametrar
- gradient_accumulation_steps
antal steg som toningar ska ackumuleras före en bakåt
Undantag
Upphöjt om dest är en filsökväg och filen redan finns.
Upphöjt om dest är en öppen fil och filen inte kan skrivas.
Attribut
base_path
creation_context
featurization
id
Resurs-ID:t.
Returer
Resursens globala ID, ett ARM-ID (Azure Resource Manager).
Returtyp
inputs
limits
log_files
log_verbosity
outputs
primary_metric
search_space
status
Jobbets status.
Vanliga värden som returneras är "Running", "Completed" och "Failed". Alla möjliga värden är:
NotStarted – det här är ett tillfälligt tillstånd som körningsobjekt på klientsidan befinner sig i innan molnöverföringen.
Start – Körningen har börjat bearbetas i molnet. Anroparen har ett körnings-ID just nu.
Etablering – beräkning på begäran skapas för en viss jobböverföring.
Förbereder – Körningsmiljön förbereds och är i ett av två steg:
Docker-avbildningsversion
konfiguration av conda-miljö
I kö – Jobbet placeras i kö på beräkningsmålet. I BatchAI är jobbet till exempel i ett köat tillstånd
medan du väntar på att alla begärda noder ska vara klara.
Körs – Jobbet har börjat köras på beräkningsmålet.
Slutför – Körningen av användarkod har slutförts och körningen är i efterbearbetningssteg.
CancelRequested – Annullering har begärts för jobbet.
Slutförd – körningen har slutförts. Detta omfattar både körning och körning av användarkod
efterbearbetningssteg.
Misslyckades – körningen misslyckades. Vanligtvis innehåller egenskapen Error på en körning information om varför.
Avbryts – följer en begäran om annullering och anger att körningen nu har avbrutits.
Svarar inte – För körningar som har Pulsslag aktiverat har inga pulsslag nyligen skickats.
Returer
Status för jobbet.
Returtyp
studio_url
sweep
task_type
Hämta aktivitetstyp.
Returer
Den typ av uppgift som ska köras. Möjliga värden är: "classification", "regression", "forecasting".
Returtyp
test_data
training_data
training_parameters
type
validation_data
Azure SDK for Python