TextNerJob Třída

Reference

Konfigurace pro úlohu Text NER automatizovaného strojového učení

Inicializuje novou úlohu Text NER automatizovaného strojového učení.

Dědičnost: azure.ai.ml.entities._job.automl.nlp.automl_nlp_job.AutoMLNLPJob

TextNerJob

Konstruktor

TextNerJob(*, training_data: Input | None = None, validation_data: Input | None = None, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs)

Parametry

training_data

Vyžadováno

Trénovací data, která se mají použít pro trénování

validation_data

Vyžadováno

Ověřovací data, která se mají použít k vyhodnocení natrénovaného modelu

primary_metric

Vyžadováno

Primární metrika, která se má zobrazit.

log_verbosity

Vyžadováno

Úroveň podrobností protokolu

kwargs

Vyžadováno

Argumenty specifické pro úlohu

Metody

dump	Vytvoří výpis obsahu úlohy do souboru ve formátu YAML.
extend_search_space	Přidejte (a) vyhledávací prostory pro tuto úlohu NLP automatizovaného strojového učení.
set_data
set_featurization
set_limits
set_sweep	Nastavení úklidu pro všechny úlohy NLP automatizovaného strojového učení
set_training_parameters	Opravte určité parametry trénování v průběhu trénování pro všechny kandidáty. Předat. Musí se jednat o kladné celé číslo. :keyword learning_rate: počáteční rychlost učení. Musí se jednat o plovoucí hodnotu (0, 1). :keyword learning_rate_scheduler: typ plánovače rychlosti učení. Musí si vybrat z "lineární", "kosinus", "cosine_with_restarts", "polynomické", "konstanta" a "constant_with_warmup". :keyword model_name: název modelu, který se má použít během trénování. Musí si vybrat z 'bert-base-cased', 'bert-base-uncased', 'bert-base-multilingual-cased', 'bert-base-german-cased', 'bert-large-cased', 'bert-large-uncased', 'distilbert-base-cased', 'distilbert-base-uncased', 'roberta-base', 'roberta-large', 'distilroberta-base', 'xlm-roberta-base', 'xlm-roberta-large', xlnet-base-cased' a 'xlnet-large-cased'. :keyword number_of_epochs: počet epoch pro trénování. Musí být kladné celé číslo. :keyword training_batch_size: velikost dávky během trénování. Musí být kladné celé číslo. :keyword validation_batch_size: velikost dávky během ověřování. Musí být kladné celé číslo. :keyword warmup_ratio: poměr celkového počtu kroků trénování, který se používá pro lineární zahřátí od 0 do learning_rate. Musí být plovoucí v [0, 1]. :keyword weight_decay: hodnota hmotnosti se rozpadá, když optimalizátor je sgd, adam nebo adamw. Musí se jednat o float v rozsahu [0, 1]. :return: Žádné.

dump

Vytvoří výpis obsahu úlohy do souboru ve formátu YAML.

dump(dest: str | PathLike | IO, **kwargs) -> None

Parametry

dest: Union[<xref:PathLike>, str, IO[AnyStr]]

Vyžadováno

Místní cesta nebo datový proud souboru, do které se má obsah YAML zapisovat. Pokud je dest cesta k souboru, vytvoří se nový soubor. Pokud je dest otevřený soubor, zapíše se přímo do souboru.

kwargs: dict

Další argumenty, které se mají předat serializátoru YAML.

Výjimky

FileExistsError

Vyvolána, pokud je dest cesta k souboru a soubor již existuje.

IOError

Vyvolá se, pokud je soubor dest otevřený a soubor nelze zapisovat.

extend_search_space

Přidejte (a) vyhledávací prostory pro tuto úlohu NLP automatizovaného strojového učení.

extend_search_space(value: SearchSpace | List[SearchSpace]) -> None

Parametry

value: Union[SearchSpace, List[SearchSpace]]

Vyžadováno

Buď SearchSpace objekt nebo seznam Objektů SearchSpace s nlp-specifické parametry.

Návraty

Žádné

Výjimky

FileExistsError

Vyvolána, pokud je dest cesta k souboru a soubor již existuje.

IOError

Vyvolá se, pokud je soubor dest otevřený a soubor nelze zapisovat.

set_data

set_data(*, training_data: Input, target_column_name: str, validation_data: Input) -> None

Výjimky

FileExistsError

Vyvolána, pokud je dest cesta k souboru a soubor již existuje.

IOError

Vyvolá se, pokud je soubor dest otevřený a soubor nelze zapisovat.

set_featurization

set_featurization(*, dataset_language: str | None = None) -> None

Výjimky

FileExistsError

Vyvolána, pokud je dest cesta k souboru a soubor již existuje.

IOError

Vyvolá se, pokud je soubor dest otevřený a soubor nelze zapisovat.

set_limits

set_limits(*, max_trials: int = 1, max_concurrent_trials: int = 1, max_nodes: int = 1, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None

Výjimky

FileExistsError

Vyvolána, pokud je dest cesta k souboru a soubor již existuje.

IOError

Vyvolá se, pokud je soubor dest otevřený a soubor nelze zapisovat.

set_sweep

Nastavení úklidu pro všechny úlohy NLP automatizovaného strojového učení

set_sweep(*, sampling_algorithm: str | SamplingAlgorithmType, early_termination: EarlyTerminationPolicy | None = None)

Parametry

sampling_algorithm

Povinná hodnota. Určuje typ algoritmu vzorkování hyperparametrů. Mezi možné hodnoty patří: "Grid", "Random" a "Bayesian".

early_termination

Volitelné zásady předčasného ukončení, které ukončí kandidáty na školení s nízkým výkonem.

Návraty

Žádné

Výjimky

FileExistsError

Vyvolána, pokud je dest cesta k souboru a soubor již existuje.

IOError

Vyvolá se, pokud je soubor dest otevřený a soubor nelze zapisovat.

set_training_parameters

Opravte určité parametry trénování v průběhu trénování pro všechny kandidáty.

Předat. Musí se jednat o kladné celé číslo. :keyword learning_rate: počáteční rychlost učení. Musí se jednat o plovoucí hodnotu (0, 1). :keyword learning_rate_scheduler: typ plánovače rychlosti učení. Musí si vybrat z "lineární", "kosinus", "cosine_with_restarts", "polynomické", "konstanta" a "constant_with_warmup". :keyword model_name: název modelu, který se má použít během trénování. Musí si vybrat z 'bert-base-cased', 'bert-base-uncased', 'bert-base-multilingual-cased', 'bert-base-german-cased', 'bert-large-cased', 'bert-large-uncased', 'distilbert-base-cased', 'distilbert-base-uncased', 'roberta-base', 'roberta-large', 'distilroberta-base', 'xlm-roberta-base', 'xlm-roberta-large', xlnet-base-cased' a 'xlnet-large-cased'. :keyword number_of_epochs: počet epoch pro trénování. Musí být kladné celé číslo. :keyword training_batch_size: velikost dávky během trénování. Musí být kladné celé číslo. :keyword validation_batch_size: velikost dávky během ověřování. Musí být kladné celé číslo. :keyword warmup_ratio: poměr celkového počtu kroků trénování, který se používá pro lineární zahřátí od 0 do learning_rate. Musí být plovoucí v [0, 1]. :keyword weight_decay: hodnota hmotnosti se rozpadá, když optimalizátor je sgd, adam nebo adamw. Musí se jednat o float v rozsahu [0, 1]. :return: Žádné.

set_training_parameters(*, gradient_accumulation_steps: int | None = None, learning_rate: float | None = None, learning_rate_scheduler: str | NlpLearningRateScheduler | None = None, model_name: str | None = None, number_of_epochs: int | None = None, training_batch_size: int | None = None, validation_batch_size: int | None = None, warmup_ratio: float | None = None, weight_decay: float | None = None) -> None

Parametry

gradient_accumulation_steps

počet kroků, po kterých se mají nahromadit přechody před zpětným

Výjimky

FileExistsError

Vyvolána, pokud je dest cesta k souboru a soubor již existuje.

IOError

Vyvolá se, pokud je soubor dest otevřený a soubor nelze zapisovat.

Atributy

base_path

Základní cesta prostředku.

Návraty

Základní cesta prostředku.

Návratový typ

str

creation_context

Kontext vytvoření prostředku.

Návraty

Metadata vytvoření prostředku.

Návratový typ

Optional[SystemData]

featurization

id

ID prostředku.

Návraty

Globální ID prostředku, ID Azure Resource Manager (ARM).

Návratový typ

Optional[str]

inputs

limits

log_files

Výstupní soubory úlohy.

Návraty

Slovník názvů protokolů a adres URL.

Návratový typ

Optional[Dict[str, str]]

log_verbosity

outputs

primary_metric

search_space

status

Stav úlohy.

Mezi běžné vrácené hodnoty patří Spuštěno, Dokončeno a Neúspěšné. Všechny možné hodnoty jsou:

NotStarted – jedná se o dočasný stav, ve který se objekty Run na straně klienta nacházejí před odesláním do cloudu.
Spuštění – Spuštění se začalo zpracovávat v cloudu. Volající má v tuto chvíli ID spuštění.
Zřizování – pro odeslání úlohy se vytváří výpočetní prostředky na vyžádání.
Příprava – Prostředí spuštění se připravuje a je v jedné ze dvou fází:
- Sestavení image Dockeru
- Nastavení prostředí conda
Zařazeno do fronty – Úloha je zařazená do fronty v cílovém výpočetním objektu. Například ve službě BatchAI je úloha ve frontě.

při čekání na připravenost všech požadovaných uzlů.
Spuštěno – Úloha se začala spouštět na cílovém výpočetním objektu.
Finalizace – Spuštění uživatelského kódu bylo dokončeno a spuštění je ve fázích následného zpracování.
CancelRequested – pro úlohu bylo požádáno o zrušení.
Dokončeno – Spuštění bylo úspěšně dokončeno. To zahrnuje spuštění uživatelského kódu i spuštění.

fáze následného zpracování.
Neúspěšné – spuštění se nezdařilo. Vlastnost Error při spuštění obvykle obsahuje podrobné informace o tom, proč tomu tak je.
Zrušeno – následuje žádost o zrušení a indikuje, že spuštění se teď úspěšně zrušilo.
Nereaguje – U spuštění s povolenými prezenčními signály se v nedávné době neodeslal žádný prezenční signál.

Návraty

Stav úlohy.

Návratový typ

Optional[str]

studio_url

Koncový bod studia Azure ML.

Návraty

Adresa URL stránky s podrobnostmi úlohy

Návratový typ

Optional[str]

sweep

task_type

Získejte typ úkolu.

Návraty

Typ úlohy, která se má spustit. Mezi možné hodnoty patří: "classification", "regression", "forecasting" (prognózování).

Návratový typ

str

test_data

Získání testovacích dat

Návraty

Testování vstupu dat

Návratový typ

Input

training_data

Získejte trénovací data.

Návraty

Trénování vstupu dat

Návratový typ

Input

training_parameters

type

Typ úlohy.

Návraty

Typ úlohy.

Návratový typ

Optional[str]

validation_data

Získání ověřovacích dat

Návraty

Ověřovací vstup dat

Návratový typ

Input

Sdílet prostřednictvím

TextNerJob Třída

Konstruktor

Parametry

Metody

dump

Parametry

Výjimky

extend_search_space

Parametry

Návraty

Výjimky

set_data

Výjimky

set_featurization

Výjimky

set_limits

Výjimky

set_sweep

Parametry

Návraty

Výjimky

set_training_parameters

Parametry

Výjimky

Atributy

base_path

Návraty

Návratový typ

creation_context

Návraty

Návratový typ

featurization

id

Návraty

Návratový typ

inputs

limits

log_files

Návraty

Návratový typ

log_verbosity

outputs

primary_metric

search_space

status

Návraty

Návratový typ

studio_url

Návraty

Návratový typ

sweep

task_type

Návraty

Návratový typ

test_data

Návraty

Návratový typ

training_data

Návraty

Návratový typ

training_parameters

type

Návraty

Návratový typ

validation_data

Návraty

Návratový typ

Další materiály