Estimator Třída

Představuje obecný estimátor pro trénovat data pomocí jakékoli zadané architektury.

ZASTARALÉ. Použijte objekt s ScriptRunConfig vlastním definovaným prostředím nebo kurátorovaným prostředím Azure ML. Úvod ke konfiguraci spuštění experimentů pomocí ScriptRunConfig najdete v tématu Konfigurace a odeslání trénovacích spuštění.

Tato třída je určená pro použití s architekturami strojového učení, které ještě nemají předem nakonfigurovaný estimátor služby Azure Machine Learning. Existují předem nakonfigurované estimátory pro Chainer, PyTorch, TensorFlowa SKLearn. Pokud chcete vytvořit estimátor, který není předkonfigurovaný, přečtěte si téma trénování modelů pomocí nástroje pro posouzení pomocí služby Azure Machine Learning.

Třída Estimator zabalí informace o konfiguraci spuštění, aby pomohla zjednodušit úlohy určení způsobu spuštění skriptu. Podporuje spouštění s jedním uzlem i s více uzly. Spuštění estimátoru vytvoří model ve výstupním adresáři zadaném v trénovacím skriptu.

Inicializujte estimátor.

používá se azureml.core.environment._DEFAULT_SHM_SIZE. Další informace najdete v referenčních informacích o spuštění Dockeru. :type shm_size: str :p aram resume_from: Cesta k datům obsahující soubory kontrolního bodu nebo modelu, ze kterých chcete experiment obnovit. :type resume_from: azureml.data.datapath.DataPath :p aram max_run_duration_seconds: Maximální povolená doba spuštění. Azure ML se pokusí automaticky

zrušte spuštění, pokud trvá déle než tato hodnota.

Dědičnost
azureml.train.estimator._mml_base_estimator.MMLBaseEstimator
Estimator

Konstruktor

Estimator(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, node_count=1, process_count_per_node=1, distributed_backend=None, distributed_training=None, use_gpu=False, use_docker=True, custom_docker_base_image=None, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, source_directory_data_store=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)

Parametry

source_directory
str
Vyžadováno

Místní adresář obsahující konfiguraci experimentu a soubory kódu potřebné pro trénovací úlohu.

compute_target
AbstractComputeTarget nebo str
Vyžadováno

Cílový výpočetní objekt, ve kterém bude probíhat trénování. Může to být buď objekt, nebo řetězec "local".

vm_size
str
Vyžadováno

Velikost virtuálního počítače cílového výpočetního objektu, který se vytvoří pro trénování. Podporované hodnoty: Libovolná velikost virtuálního počítače Azure.

vm_priority
str
Vyžadováno

Priorita virtuálního počítače cílového výpočetního objektu, který se vytvoří pro trénování. Pokud není zadáno, použije se "vyhrazené".

Podporované hodnoty: "dedicated" a "lowpriority".

To se projeví pouze v případě, vm_size že je parametr zadaný ve vstupu.

entry_script
str
Vyžadováno

Relativní cesta k souboru, který se používá k zahájení trénování.

script_params
dict
Vyžadováno

Slovník argumentů příkazového řádku, který se má předat do trénovacího skriptu zadaného v entry_scriptnástroji .

node_count
int
Vyžadováno

Počet uzlů v cílovém výpočetním objektu, které se používají pro trénování. Pokud je větší než 1, spustí se distribuovaná úloha MPI.

process_count_per_node
int
Vyžadováno

Počet procesů (neboli "pracovních procesů"), které se mají spustit na jednotlivých uzlech. Pokud je větší než 1, spustí se distribuovaná úloha MPI. U distribuovaných AmlCompute úloh se podporuje pouze cíl.

distributed_backend
str
Vyžadováno

Komunikační back-end pro distribuované trénování.

ZASTARALÉ. distributed_training Použijte parametr .

Podporované hodnoty: mpi. "mpi" představuje MPI/Horovod.

Tento parametr je povinný, pokud node_count nebo process_count_per_node> 1.

Pokud node_count je == 1 a process_count_per_node == 1, nebude použit žádný back-end, pokud není back-end explicitně nastaven. AmlCompute Pro distribuované trénování je podporován pouze cíl.

distributed_training
Mpi
Vyžadováno

Parametry pro spuštění distribuované trénovací úlohy

Pokud chcete spustit distribuovanou úlohu s back-endem MPI, zadejte process_count_per_nodepomocí Mpi objektu .

use_gpu
bool
Vyžadováno

Určuje, jestli by prostředí pro spuštění experimentu mělo podporovat GPU. Pokud ano, použije se v prostředí výchozí image Dockeru založená na GPU. Pokud je false, použije se image založená na procesoru. Výchozí image Dockeru (CPU nebo GPU) se použijí jenom v případě, že custom_docker_image parametr není nastavený. Toto nastavení se používá jenom v cílových výpočetních prostředcích s povoleným Dockerem.

use_docker
bool
Vyžadováno

Určuje, jestli má být prostředí pro spuštění experimentu založené na Dockeru.

custom_docker_base_image
str
Vyžadováno

Název image Dockeru, ze které se vytvoří image, která se má použít pro trénování.

ZASTARALÉ. custom_docker_image Použijte parametr .

Pokud není nastavená, jako základní image se použije výchozí image založená na procesoru.

custom_docker_image
str
Vyžadováno

Název image Dockeru, ze které se vytvoří image, která se má použít pro trénování. Pokud není nastavená, jako základní image se použije výchozí image založená na procesoru. Zadejte pouze image dostupné ve veřejných úložištích Dockeru (Docker Hub). Pokud chcete použít image z privátního úložiště Dockeru, použijte místo toho parametr konstruktoru environment_definition .

image_registry_details
ContainerRegistry
Vyžadováno

Podrobnosti o registru imagí Dockeru

user_managed
bool
Vyžadováno

Určuje, jestli Azure ML opakovaně používá existující prostředí Pythonu. Pokud je false, vytvoří se prostředí Pythonu na základě specifikace závislostí conda.

conda_packages
list
Vyžadováno

Seznam řetězců představujících balíčky conda, které se mají přidat do prostředí Pythonu pro experiment.

pip_packages
list
Vyžadováno

Seznam řetězců představujících balíčky pip, které se mají přidat do prostředí Pythonu pro experiment.

conda_dependencies_file_path
str
Vyžadováno

Relativní cesta k závislosti conda soubor yaml. Pokud je zadáno, Azure ML nenainstaluje žádné balíčky související s architekturou.

ZASTARALÉ. conda_dependencies_file Použijte paramenter.

Zadejte nebo conda_dependencies_file_pathconda_dependencies_file. Pokud jsou zadány obě možnosti, conda_dependencies_file použije se.

pip_requirements_file_path
str
Vyžadováno

Relativní cesta k textovému souboru pip.

ZASTARALÉ. pip_requirements_file Použijte parametr .

Tento parametr lze zadat v kombinaci s parametrem pip_packages . Zadejte nebo pip_requirements_file_pathpip_requirements_file. Pokud jsou zadány obě možnosti, pip_requirements_file použije se.

conda_dependencies_file
str
Vyžadováno

Relativní cesta k závislosti conda soubor yaml. Pokud je zadáno, Azure ML nenainstaluje žádné balíčky související s architekturou.

pip_requirements_file
str
Vyžadováno

Relativní cesta k textovému souboru pip. Tento parametr lze zadat v kombinaci s parametrem pip_packages .

environment_variables
dict
Vyžadováno

Slovník názvů a hodnot proměnných prostředí. Tyto proměnné prostředí se nastavují v procesu, ve kterém se spouští uživatelský skript.

environment_definition
Environment
Vyžadováno

Definice prostředí pro experiment. Zahrnuje PythonSection, DockerSection a proměnné prostředí. Pomocí tohoto parametru lze nastavit jakoukoli možnost prostředí, která není přímo zpřístupněna prostřednictvím jiných parametrů pro konstrukci estimátoru. Pokud je tento parametr zadaný, bude mít přednost před ostatními parametry souvisejícími s prostředím, jako use_gpujsou , custom_docker_image, conda_packagesnebo pip_packages. U neplatných kombinací budou hlášeny chyby.

inputs
list
Vyžadováno

Seznam DataReference objektů nebo DatasetConsumptionConfig , které se mají použít jako vstup.

source_directory_data_store
Datastore
Vyžadováno

Záložní úložiště dat pro sdílenou složku projektu.

shm_size
str
Vyžadováno

Velikost bloku sdílené paměti kontejneru Dockeru. Pokud není nastavená, použije se výchozí azureml.core.environment._DEFAULT_SHM_SIZE. Další informace najdete v referenčních informacích o spuštění Dockeru.

resume_from
DataPath
Vyžadováno

Cesta k datům obsahující kontrolní bod nebo soubory modelu, ze kterých chcete pokračovat v experimentu.

max_run_duration_seconds
int
Vyžadováno

Maximální povolený čas pro spuštění. Azure ML se pokusí automaticky zrušit spuštění, pokud trvá déle než tato hodnota.

source_directory
str
Vyžadováno

Místní adresář obsahující konfiguraci experimentu a soubory kódu potřebné pro trénovací úlohu.

compute_target
AbstractComputeTarget nebo str
Vyžadováno

Cílový výpočetní objekt, kde bude probíhat trénování. Může to být buď objekt, nebo řetězec "local".

vm_size
str
Vyžadováno

Velikost virtuálního počítače cílového výpočetního objektu, který se vytvoří pro trénování. Podporované hodnoty: Libovolná velikost virtuálního počítače Azure.

vm_priority
str
Vyžadováno

Priorita virtuálního počítače cílového výpočetního objektu, který se vytvoří pro trénování. Pokud není zadaný, použije se "dedicated".

Podporované hodnoty: dedicated a lowpriority.

To se projeví pouze v případě, že vm_size je parametr zadán ve vstupu.

entry_script
str
Vyžadováno

Relativní cesta k souboru, která slouží k zahájení trénování.

script_params
dict
Vyžadováno

Slovník argumentů příkazového řádku, který se má předat trénovacímu skriptu zadanému v entry_script.

node_count
int
Vyžadováno

Počet uzlů ve výpočetním cíli, které se používají k trénování. Pokud je větší než 1, spustí se distribuovaná úloha MPI. AmlCompute Pro distribuované úlohy se podporuje pouze cíl.

process_count_per_node
int
Vyžadováno

Počet procesů na uzel Pokud je větší než 1, spustí se distribuovaná úloha MPI. AmlCompute Pro distribuované úlohy se podporuje pouze cíl.

distributed_backend
str
Vyžadováno

Komunikační back-end pro distribuované trénování.

ZASTARALÉ. distributed_training Použijte parametr .

Podporované hodnoty: mpi. "mpi" představuje MPI/Horovod.

Tento parametr je povinný, když node_count nebo process_count_per_node> 1.

Pokud node_count == 1 a process_count_per_node == 1, nebude použit žádný back-end, pokud není back-end explicitně nastaven. AmlCompute Distribuované trénování podporuje pouze cíl.

distributed_training
Mpi
Vyžadováno

Parametry pro spuštění distribuované trénovací úlohy

Pokud chcete spustit distribuovanou úlohu s back-endem MPI, zadejte pomocí Mpi objektu process_count_per_node.

use_gpu
bool
Vyžadováno

Určuje, jestli by prostředí pro spuštění experimentu mělo podporovat GPU. Pokud je true, použije se v prostředí výchozí image Dockeru založená na GPU. Pokud je false, použije se image založená na procesoru. Výchozí image Dockeru (CPU nebo GPU) se použijí jenom v případě, že custom_docker_image parametr není nastavený. Toto nastavení se používá jenom v cílových výpočetních objektech s podporou Dockeru.

use_docker
bool
Vyžadováno

Určuje, jestli má být prostředí pro spuštění experimentu založené na Dockeru.

custom_docker_base_image
str
Vyžadováno

Vytvoří se název image Dockeru, ze které se image použije pro trénování.

ZASTARALÉ. custom_docker_image Použijte parametr .

Pokud není nastavená, jako základní image se použije výchozí image založená na procesoru.

custom_docker_image
str
Vyžadováno

Vytvoří se název image Dockeru, ze které se image použije pro trénování. Pokud není nastavená, jako základní image se použije výchozí image založená na procesoru. Zadejte pouze image dostupné ve veřejných úložištích Dockeru (Docker Hub). Pokud chcete použít image z privátního úložiště Dockeru, použijte místo toho parametr konstruktoru environment_definition .

image_registry_details
ContainerRegistry
Vyžadováno

Podrobnosti o registru imagí Dockeru

user_managed
bool
Vyžadováno

Určuje, jestli Azure ML znovu použije existující prostředí Pythonu. Pokud je false, vytvoří se prostředí Pythonu na základě specifikace závislostí Conda.

conda_packages
list
Vyžadováno

Seznam řetězců představujících balíčky conda, které se mají přidat do prostředí Pythonu pro experiment.

pip_packages
list
Vyžadováno

Seznam řetězců představujících balíčky pip, které se mají přidat do prostředí Pythonu pro experiment.

conda_dependencies_file_path
Vyžadováno

Relativní cesta k souboru yaml závislostí conda. Pokud zadáte tento parametr, Azure ML nenainstaluje žádné balíčky související s architekturou.

ZASTARALÉ. conda_dependencies_file Použijte paramenter.

Zadejte nebo conda_dependencies_file_pathconda_dependencies_file. Pokud jsou zadány obě, conda_dependencies_file použije se .

pip_requirements_file_path
Vyžadováno

Relativní cesta k textovému souboru požadavků pip.

ZASTARALÉ. pip_requirements_file Použijte parametr .

To lze zadat v kombinaci s parametrem pip_packages . Zadejte nebo pip_requirements_file_pathpip_requirements_file. Pokud jsou zadány obě, pip_requirements_file použije se .

pip_requirements_file
str
Vyžadováno

Relativní cesta k textovému souboru požadavků pip. To lze zadat v kombinaci s parametrem pip_packages .

environment_variables
dict
Vyžadováno

Slovník názvů a hodnot proměnných prostředí. Tyto proměnné prostředí se nastavují v procesu, ve kterém se spouští uživatelský skript.

environment_definition
Environment
Vyžadováno

Definice prostředí experimentu Zahrnuje PythonSection, DockerSection a proměnné prostředí. Pomocí tohoto parametru lze nastavit jakoukoli možnost prostředí, která není přímo zpřístupněna prostřednictvím jiných parametrů pro konstrukci estimátoru. Pokud je tento parametr zadaný, bude mít přednost před ostatními parametry souvisejícími s prostředím, jako use_gpujsou , custom_docker_image, conda_packagesnebo pip_packages. U neplatných kombinací budou hlášeny chyby.

inputs
list
Vyžadováno

Seznam DataReference objektů nebo DatasetConsumptionConfig , které se mají použít jako vstup.

source_directory_data_store
Datastore
Vyžadováno

Záložní úložiště dat pro sdílenou složku projektu.

shm_size
Vyžadováno

Velikost bloku sdílené paměti kontejneru Dockeru. Pokud není nastavená, výchozí hodnota

_disable_validation
bool
Vyžadováno

Před spuštěním odeslání zakažte ověřování skriptů. Výchozí hodnota je True.

_show_lint_warnings
bool
Vyžadováno

Zobrazit upozornění na lintování skriptů Výchozí hodnota je Nepravda.

_show_package_warnings
bool
Vyžadováno

Zobrazit upozornění ověření balíčku. Výchozí hodnota je Nepravda.