TextClassificationMultilabelJob Třída
Konfigurace pro úlohu více popisku klasifikace textu AutoML
Inicializuje novou úlohu Klasifikace textu AutoML s více popisky.
- Dědičnost
-
azure.ai.ml.entities._job.automl.nlp.automl_nlp_job.AutoMLNLPJobTextClassificationMultilabelJob
Konstruktor
TextClassificationMultilabelJob(*, target_column_name: str | None = None, training_data: Input | None = None, validation_data: Input | None = None, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs)
Parametry
- target_column_name
Název cílového sloupce
- training_data
Trénovací data, která se mají použít pro trénování
- validation_data
Ověřovací data, která se mají použít k vyhodnocení natrénovaného modelu
- primary_metric
Primární metrika, která se má zobrazit.
- log_verbosity
Úroveň podrobností protokolu
- kwargs
Argumenty specifické pro úlohu
Metody
dump |
Vytvoří výpis obsahu úlohy do souboru ve formátu YAML. |
extend_search_space |
Přidejte (a) vyhledávací prostory pro tuto úlohu automatického strojového učení NLP. |
set_data | |
set_featurization | |
set_limits | |
set_sweep |
Nastavení úklidu pro všechny úlohy automatického strojového učení NLP. |
set_training_parameters |
Opravte určité trénovací parametry v rámci trénovacího postupu pro všechny kandidáty. Předat. Toto musí být kladné celé číslo. :keyword learning_rate: počáteční rychlost učení. Musí být float in (0, 1). :keyword learning_rate_scheduler: typ plánovače rychlosti učení. Musí si vybrat z "lineární", "kosinus", "cosine_with_restarts", "polynomický", "konstanta" a "constant_with_warmup". :keyword model_name: název modelu, který se má použít během trénování. Musí si vybrat z 'bert-base-cased', 'bert-base-uncased', 'bert-base-multilingual-cased', 'bert-base-german-cased', 'bert-large-cased', "bert-large-uncased", "distilbert-base-cased", "distilbert-base-uncased", "roberta-base", "roberta-large", "distilroberta-base", "xlm-roberta-base", "xlm-roberta-large", xlnet-base-cased a "xlnet-large-cased". :keyword number_of_epochs: počet epoch, se kterými se má trénovat. Musí být kladné celé číslo. :keyword training_batch_size: velikost dávky během trénování. Musí být kladné celé číslo. :keyword validation_batch_size: velikost dávky během ověřování. Musí být kladné celé číslo. :keyword warmup_ratio: poměr celkových trénovacích kroků používaných pro lineární zahřátí od 0 do learning_rate. Musí být float v [0, 1]. :keyword weight_decay: hodnota poklesu hmotnosti, když optimalizátor je sgd, adam nebo adamw. Musí se jednat o float v rozsahu [0, 1]. :return: Žádný. |
dump
Vytvoří výpis obsahu úlohy do souboru ve formátu YAML.
dump(dest: str | PathLike | IO, **kwargs) -> None
Parametry
Místní cesta nebo datový proud souboru, do které chcete zapsat obsah YAML. Pokud je dest cesta k souboru, vytvoří se nový soubor. Pokud je soubor dest otevřený, zapíše se přímo do souboru.
- kwargs
- dict
Další argumenty, které se mají předat serializátoru YAML.
Výjimky
Vyvolána, pokud je dest cesta k souboru a soubor již existuje.
Vyvolána, pokud je soubor dest otevřený a soubor není zapisovatelný.
extend_search_space
Přidejte (a) vyhledávací prostory pro tuto úlohu automatického strojového učení NLP.
extend_search_space(value: SearchSpace | List[SearchSpace]) -> None
Parametry
- value
- Union[SearchSpace, List[SearchSpace]]
buď objekt SearchSpace, nebo seznam objektů SearchSpace s parametry specifickými pro nlp.
Návraty
Žádné
Výjimky
Vyvolána, pokud je dest cesta k souboru a soubor již existuje.
Vyvolána, pokud je soubor dest otevřený a soubor není zapisovatelný.
set_data
set_data(*, training_data: Input, target_column_name: str, validation_data: Input) -> None
Výjimky
Vyvolána, pokud je dest cesta k souboru a soubor již existuje.
Vyvolána, pokud je soubor dest otevřený a soubor není zapisovatelný.
set_featurization
set_featurization(*, dataset_language: str | None = None) -> None
Výjimky
Vyvolána, pokud je dest cesta k souboru a soubor již existuje.
Vyvolána, pokud je soubor dest otevřený a soubor není zapisovatelný.
set_limits
set_limits(*, max_trials: int = 1, max_concurrent_trials: int = 1, max_nodes: int = 1, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None
Výjimky
Vyvolána, pokud je dest cesta k souboru a soubor již existuje.
Vyvolána, pokud je soubor dest otevřený a soubor není zapisovatelný.
set_sweep
Nastavení úklidu pro všechny úlohy automatického strojového učení NLP.
set_sweep(*, sampling_algorithm: str | SamplingAlgorithmType, early_termination: EarlyTerminationPolicy | None = None)
Parametry
- sampling_algorithm
Povinná hodnota. Určuje typ algoritmu vzorkování hyperparametrů. Mezi možné hodnoty patří: "Grid", "Random" a "Bayesian".
- early_termination
Volitelné zásady předčasného ukončení, které ukončí špatně fungující kandidáty na školení.
Návraty
Žádné
Výjimky
Vyvolána, pokud je dest cesta k souboru a soubor již existuje.
Vyvolána, pokud je soubor dest otevřený a soubor není zapisovatelný.
set_training_parameters
Opravte určité trénovací parametry v rámci trénovacího postupu pro všechny kandidáty.
Předat. Toto musí být kladné celé číslo. :keyword learning_rate: počáteční rychlost učení. Musí být float in (0, 1). :keyword learning_rate_scheduler: typ plánovače rychlosti učení. Musí si vybrat z "lineární", "kosinus", "cosine_with_restarts", "polynomický", "konstanta" a "constant_with_warmup". :keyword model_name: název modelu, který se má použít během trénování. Musí si vybrat z 'bert-base-cased', 'bert-base-uncased', 'bert-base-multilingual-cased', 'bert-base-german-cased', 'bert-large-cased', "bert-large-uncased", "distilbert-base-cased", "distilbert-base-uncased", "roberta-base", "roberta-large", "distilroberta-base", "xlm-roberta-base", "xlm-roberta-large", xlnet-base-cased a "xlnet-large-cased". :keyword number_of_epochs: počet epoch, se kterými se má trénovat. Musí být kladné celé číslo. :keyword training_batch_size: velikost dávky během trénování. Musí být kladné celé číslo. :keyword validation_batch_size: velikost dávky během ověřování. Musí být kladné celé číslo. :keyword warmup_ratio: poměr celkových trénovacích kroků používaných pro lineární zahřátí od 0 do learning_rate. Musí být float v [0, 1]. :keyword weight_decay: hodnota poklesu hmotnosti, když optimalizátor je sgd, adam nebo adamw. Musí se jednat o float v rozsahu [0, 1]. :return: Žádný.
set_training_parameters(*, gradient_accumulation_steps: int | None = None, learning_rate: float | None = None, learning_rate_scheduler: str | NlpLearningRateScheduler | None = None, model_name: str | None = None, number_of_epochs: int | None = None, training_batch_size: int | None = None, validation_batch_size: int | None = None, warmup_ratio: float | None = None, weight_decay: float | None = None) -> None
Parametry
- gradient_accumulation_steps
počet kroků, ve kterých se mají nahromadit přechody před zpětným přechodem
Výjimky
Vyvolána, pokud je dest cesta k souboru a soubor již existuje.
Vyvolána, pokud je soubor dest otevřený a soubor není zapisovatelný.
Atributy
base_path
creation_context
Kontext vytvoření prostředku.
Návraty
Metadata vytvoření prostředku.
Návratový typ
featurization
id
ID prostředku.
Návraty
Globální ID prostředku, ID Azure Resource Manager (ARM).
Návratový typ
inputs
limits
log_files
Výstupní soubory úlohy.
Návraty
Slovník názvů protokolů a adres URL.
Návratový typ
log_verbosity
outputs
primary_metric
search_space
status
Stav úlohy.
Mezi běžné vrácené hodnoty patří "Spuštěno", "Dokončeno" a "Selhání". Všechny možné hodnoty jsou:
NotStarted – jedná se o dočasný stav, ve který jsou objekty Spuštění na straně klienta před odesláním do cloudu.
Spuštění – Spuštění se začalo zpracovávat v cloudu. Volající má v tuto chvíli ID spuštění.
Zřizování – pro odeslání dané úlohy se vytváří výpočetní prostředky na vyžádání.
Příprava – Prostředí spuštění se připravuje a je v jedné ze dvou fází:
Sestavení image Dockeru
Nastavení prostředí conda
Ve frontě – úloha je zařazená do fronty v cílovém výpočetním objektu. Například ve službě BatchAI je úloha ve stavu zařazená do fronty.
při čekání na připravenost všech požadovaných uzlů.
Spuštěno – Úloha se začala spouštět na cílovém výpočetním objektu.
Finalizace – Spuštění uživatelského kódu bylo dokončeno a spuštění je ve fázích následného zpracování.
CancelRequested – pro úlohu bylo požadováno zrušení.
Dokončeno – spuštění bylo úspěšně dokončeno. To zahrnuje jak spuštění uživatelského kódu, tak spuštění.
fáze následného zpracování.
Selhání – Spuštění se nezdařilo. Vlastnost Error při spuštění obvykle obsahuje podrobnosti o důvodech.
Zrušeno – následuje žádost o zrušení a označuje, že spuštění se teď úspěšně zrušilo.
Nereaguje – u spuštění, která mají povolené prezenční signály, se v nedávné době neodeslal žádný prezenční signál.
Návraty
Stav úlohy.
Návratový typ
studio_url
Koncový bod studia Azure ML.
Návraty
Adresa URL stránky s podrobnostmi o úloze
Návratový typ
sweep
task_type
Získání typu úkolu
Návraty
Typ úlohy, která se má spustit. Mezi možné hodnoty patří: "classification", "regression", "forecasting".
Návratový typ
test_data
training_data
training_parameters
type
validation_data
Azure SDK for Python
Váš názor
https://aka.ms/ContentUserFeedback.
Připravujeme: V průběhu roku 2024 budeme postupně vyřazovat problémy z GitHub coby mechanismus zpětné vazby pro obsah a nahrazovat ho novým systémem zpětné vazby. Další informace naleznete v tématu:Odeslat a zobrazit názory pro