Estimator Třída

Představuje obecný estimátor pro trénování dat pomocí libovolné zadané architektury.

ZAVRHOVANÝ. ScriptRunConfig Použijte objekt s vlastním definovaným prostředím nebo kurátorovaným prostředím Azure ML. Úvod ke konfiguraci spuštění experimentů pomocí ScriptRunConfig najdete v tématu Konfigurace a odeslání trénovacích běhů.

Tato třída je určená pro použití s architekturami strojového učení, které ještě nemají předem nakonfigurovaný estimátor služby Azure Machine Learning. Předkonfigurované estimátory existují pro Chainer, PyTorch, TensorFlowa SKLearn. Pokud chcete vytvořit estimátor, který není předkonfigurovaný, přečtěte si téma Trénování modelů pomocí nástroje estimator.

Třída estimátoru zabalí informace o spuštění konfigurace, aby zjednodušila úlohy určení způsobu spuštění skriptu. Podporuje spouštění s jedním uzlem i více uzlů. Spuštění estimátoru vytvoří model ve výstupním adresáři zadaném ve vašem trénovacím skriptu.

Inicializuje estimátor.

azureml.core.environment._DEFAULT_SHM_SIZE se používá. Další informace najdete v referenčních informacích ke spuštění Dockeru. :type shm_size: str :p aram resume_from: Datová cesta obsahující kontrolní bod nebo soubory modelu, ze kterých chcete experiment obnovit. :type resume_from: azureml.datapath.DataPath :p aram max_run_duration_seconds: Maximální povolený čas spuštění. Azure ML se pokusí automaticky

zrušte spuštění, pokud trvá déle, než je tato hodnota.

Konstruktor

Estimator(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, node_count=1, process_count_per_node=1, distributed_backend=None, distributed_training=None, use_gpu=False, use_docker=True, custom_docker_base_image=None, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, source_directory_data_store=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)

Parametry

Name	Description
source_directory Vyžadováno	str Místní adresář obsahující soubory konfigurace experimentu a kódu potřebné pro trénovací úlohu.
compute_target Vyžadováno	AbstractComputeTarget nebo str Cílový výpočetní objekt, ve kterém bude trénování probíhat. Může to být buď objekt, nebo řetězec "local".
vm_size Vyžadováno	str Velikost virtuálního počítače cílového výpočetního objektu, který se vytvoří pro trénování. Podporované hodnoty: Libovolná velikost virtuálního počítače Azure
vm_priority Vyžadováno	str Priorita virtuálního počítače cílového výpočetního objektu, který se vytvoří pro trénování. Pokud není zadáno, použije se "dedicated". Podporované hodnoty: "dedicated" a "lowpriority". To se projeví pouze v případě, `vm_size` že je parametr zadaný ve vstupu.
entry_script Vyžadováno	str Relativní cesta k souboru použitému k zahájení trénování.
script_params Vyžadováno	dict Slovník argumentů příkazového řádku, který se má předat trénovacímu skriptu zadanému v `entry_script`.
node_count Vyžadováno	int Početuzlůch Pokud je větší než 1, spustí se distribuovaná úloha MPI.
process_count_per_node Vyžadováno	int Počet procesů (neboli pracovních procesů), které se mají spustit na každém uzlu. Pokud je větší než 1, spustí se distribuovaná úloha MPI. Distribuovaných AmlCompute úloh je podporován pouze cíl.
distributed_backend Vyžadováno	str Back-end komunikace pro distribuované trénování. ZAVRHOVANÝ. `distributed_training` Použijte parametr. Podporované hodnoty: mpi. Mpi představuje MPI/Horovod. Tento parametr je povinný, pokud `node_count` nebo `process_count_per_node`> 1. Pokud `node_count` == 1 a `process_count_per_node` == 1, nebude použit žádný back-end, pokud není back-end explicitně nastaven. AmlCompute Pro distribuované trénování se podporuje jenom cíl.
distributed_training Vyžadováno	Mpi Parametry pro spuštění distribuované trénovací úlohy Pro spuštění distribuované úlohy s back-endem MPI použijte Mpi objekt k určení `process_count_per_node`.
use_gpu Vyžadováno	bool Určuje, jestli má prostředí pro spuštění experimentu podporovat gpu. Pokud ano, použije se v prostředí výchozí image Dockeru založená na GPU. Pokud je false, použije se image založená na procesoru. Výchozí image Dockeru (CPU nebo GPU) se použijí jenom v případě, že `custom_docker_image` parametr není nastavený. Toto nastavení se používá jenom v cílových výpočetních objektech s podporou Dockeru.
use_docker Vyžadováno	bool Určuje, jestli má být prostředí ke spuštění experimentu založené na Dockeru.
custom_docker_base_image Vyžadováno	str Vytvoří se název image Dockeru, ze které se má image použít pro trénování. ZAVRHOVANÝ. `custom_docker_image` Použijte parametr. Pokud není nastavená, jako základní image se použije výchozí image založená na procesoru.
custom_docker_image Vyžadováno	str Vytvoří se název image Dockeru, ze které se má image použít pro trénování. Pokud není nastavená, jako základní image se použije výchozí image založená na procesoru. Zadejte pouze image dostupné ve veřejných úložištích Dockeru (Docker Hub). Pokud chcete použít image z privátního úložiště Dockeru, použijte místo toho parametr konstruktoru `environment_definition` .
image_registry_details Vyžadováno	ContainerRegistry Podrobnosti registru imagí Dockeru
user_managed Vyžadováno	bool Určuje, jestli Azure ML znovu používá existující prostředí Pythonu. Pokud je false, vytvoří se prostředí Pythonu na základě specifikace závislostí conda.
conda_packages Vyžadováno	list Seznam řetězců představujících balíčky conda, které se mají přidat do prostředí Pythonu pro experiment.
pip_packages Vyžadováno	list Seznam řetězců představujících balíčky pip, které se mají přidat do prostředí Pythonu pro experiment.
conda_dependencies_file_path Vyžadováno	str Relativní cesta k souboru yaml závislostí conda. Pokud je zadáno, Azure ML nenainstaluje žádné balíčky související s architekturou. ZAVRHOVANÝ. `conda_dependencies_file` Použijte paramenter. Zadejte buď `conda_dependencies_file_path` nebo `conda_dependencies_file`. Pokud jsou zadány obě, `conda_dependencies_file` použije se.
pip_requirements_file_path Vyžadováno	str Relativní cesta k textovému souboru požadavků pip. ZAVRHOVANÝ. `pip_requirements_file` Použijte parametr. Tento parametr lze zadat v kombinaci s parametrem `pip_packages` . Zadejte buď `pip_requirements_file_path` nebo `pip_requirements_file`. Pokud jsou zadány obě, `pip_requirements_file` použije se.
conda_dependencies_file Vyžadováno	str Relativní cesta k souboru yaml závislostí conda. Pokud je zadáno, Azure ML nenainstaluje žádné balíčky související s architekturou.
pip_requirements_file Vyžadováno	str Relativní cesta k textovému souboru požadavků pip. Tento parametr lze zadat v kombinaci s parametrem `pip_packages` .
environment_variables Vyžadováno	dict Slovník názvů a hodnot proměnných prostředí Tyto proměnné prostředí jsou nastavené v procesu, ve kterém se spouští uživatelský skript.
environment_definition Vyžadováno	Environment Definice prostředí pro experiment. Zahrnuje PythonSection, DockerSection a proměnné prostředí. Pomocí tohoto parametru lze nastavit jakoukoli možnost prostředí, která není přímo zpřístupněna prostřednictvím jiných parametrů pro konstrukci odhadce. Pokud je tento parametr zadán, bude mít přednost před jinými parametry souvisejícími s prostředím, jako je `use_gpu`, `custom_docker_image`, `conda_packages`nebo `pip_packages`. Chyby budou hlášeny v neplatných kombinacích.
inputs Vyžadováno	list Seznam DataReference objektů nebo DatasetConsumptionConfig objektů, které se mají použít jako vstup.
source_directory_data_store Vyžadováno	Datastore Záložní úložiště dat pro sdílenou složku projektu.
shm_size Vyžadováno	str Velikost bloku sdílené paměti kontejneru Dockeru. Pokud není nastavená, použije se výchozí azureml.core.environment._DEFAULT_SHM_SIZE. Další informace najdete v referenčních informacích ke spuštění Dockeru.
resume_from Vyžadováno	DataPath Cesta k datům obsahující soubory kontrolního bodu nebo modelu, ze kterých chcete experiment obnovit.
max_run_duration_seconds Vyžadováno	int Maximální povolená doba běhu. Azure ML se pokusí spuštění automaticky zrušit, pokud trvá déle, než je tato hodnota.
source_directory Vyžadováno	str Místní adresář obsahující soubory konfigurace experimentu a kódu potřebné pro trénovací úlohu.
compute_target Vyžadováno	AbstractComputeTarget nebo str Cílový výpočetní objekt, ve kterém bude trénování probíhat. Může to být buď objekt, nebo řetězec "local".
vm_size Vyžadováno	str Velikost virtuálního počítače cílového výpočetního objektu, který se vytvoří pro trénování. Podporované hodnoty: Libovolná velikost virtuálního počítače Azure
vm_priority Vyžadováno	str Priorita virtuálního počítače cílového výpočetního objektu, který se vytvoří pro trénování. Pokud není zadáno, použije se "dedicated". Podporované hodnoty: "dedicated" a "lowpriority". To se projeví pouze v případě, `vm_size` že je parametr zadaný ve vstupu.
entry_script Vyžadováno	str Relativní cesta k souboru použitému k zahájení trénování.
script_params Vyžadováno	dict Slovník argumentů příkazového řádku, který se má předat trénovacímu skriptu zadanému v `entry_script`.
node_count Vyžadováno	int Početuzlůch Pokud je větší než 1, spustí se distribuovaná úloha MPI. Distribuovaných AmlCompute úloh je podporován pouze cíl.
process_count_per_node Vyžadováno	int Počet procesů na uzel. Pokud je větší než 1, spustí se distribuovaná úloha MPI. Distribuovaných AmlCompute úloh je podporován pouze cíl.
distributed_backend Vyžadováno	str Back-end komunikace pro distribuované trénování. ZAVRHOVANÝ. `distributed_training` Použijte parametr. Podporované hodnoty: mpi. Mpi představuje MPI/Horovod. Tento parametr je povinný, pokud `node_count` nebo `process_count_per_node`> 1. Pokud `node_count` == 1 a `process_count_per_node` == 1, nebude použit žádný back-end, pokud není back-end explicitně nastaven. AmlCompute Pro distribuované trénování se podporuje jenom cíl.
distributed_training Vyžadováno	Mpi Parametry pro spuštění distribuované trénovací úlohy Pro spuštění distribuované úlohy s back-endem MPI použijte Mpi objekt k určení `process_count_per_node`.
use_gpu Vyžadováno	bool Určuje, jestli má prostředí pro spuštění experimentu podporovat gpu. Pokud ano, použije se v prostředí výchozí image Dockeru založená na GPU. Pokud je false, použije se image založená na procesoru. Výchozí image Dockeru (CPU nebo GPU) se použijí jenom v případě, že `custom_docker_image` parametr není nastavený. Toto nastavení se používá jenom v cílových výpočetních objektech s podporou Dockeru.
use_docker Vyžadováno	bool Určuje, jestli má být prostředí ke spuštění experimentu založené na Dockeru.
custom_docker_base_image Vyžadováno	str Vytvoří se název image Dockeru, ze které se má image použít pro trénování. ZAVRHOVANÝ. `custom_docker_image` Použijte parametr. Pokud není nastavená, jako základní image se použije výchozí image založená na procesoru.
custom_docker_image Vyžadováno	str Vytvoří se název image Dockeru, ze které se má image použít pro trénování. Pokud není nastavená, jako základní image se použije výchozí image založená na procesoru. Zadejte pouze image dostupné ve veřejných úložištích Dockeru (Docker Hub). Pokud chcete použít image z privátního úložiště Dockeru, použijte místo toho parametr konstruktoru `environment_definition` .
image_registry_details Vyžadováno	ContainerRegistry Podrobnosti registru imagí Dockeru
user_managed Vyžadováno	bool Určuje, jestli Azure ML znovu používá existující prostředí Pythonu. Pokud je false, vytvoří se prostředí Pythonu na základě specifikace závislostí conda.
conda_packages Vyžadováno	list Seznam řetězců představujících balíčky conda, které se mají přidat do prostředí Pythonu pro experiment.
pip_packages Vyžadováno	list Seznam řetězců představujících balíčky pip, které se mají přidat do prostředí Pythonu pro experiment.
conda_dependencies_file_path Vyžadováno	Relativní cesta k souboru yaml závislostí conda. Pokud je zadáno, Azure ML nenainstaluje žádné balíčky související s architekturou. ZAVRHOVANÝ. `conda_dependencies_file` Použijte paramenter. Zadejte buď `conda_dependencies_file_path` nebo `conda_dependencies_file`. Pokud jsou zadány obě, `conda_dependencies_file` použije se.
pip_requirements_file_path Vyžadováno	Relativní cesta k textovému souboru požadavků pip. ZAVRHOVANÝ. `pip_requirements_file` Použijte parametr. Dá se zadat v kombinaci s parametrem `pip_packages` . Zadejte buď `pip_requirements_file_path` nebo `pip_requirements_file`. Pokud jsou zadány obě, `pip_requirements_file` použije se.
pip_requirements_file Vyžadováno	str Relativní cesta k textovému souboru požadavků pip. Dá se zadat v kombinaci s parametrem `pip_packages` .
environment_variables Vyžadováno	dict Slovník názvů a hodnot proměnných prostředí Tyto proměnné prostředí jsou nastavené v procesu, ve kterém se spouští uživatelský skript.
environment_definition Vyžadováno	Environment Definice prostředí pro experiment. Zahrnuje PythonSection, DockerSection a proměnné prostředí. Pomocí tohoto parametru lze nastavit jakoukoli možnost prostředí, která není přímo zpřístupněna prostřednictvím jiných parametrů pro konstrukci odhadce. Pokud je tento parametr zadán, bude mít přednost před jinými parametry souvisejícími s prostředím, jako je `use_gpu`, `custom_docker_image`, `conda_packages`nebo `pip_packages`. Chyby budou hlášeny v neplatných kombinacích.
inputs Vyžadováno	list Seznam DataReference objektů nebo DatasetConsumptionConfig objektů, které se mají použít jako vstup.
source_directory_data_store Vyžadováno	Datastore Záložní úložiště dat pro sdílenou složku projektu.
shm_size Vyžadováno	Velikost bloku sdílené paměti kontejneru Dockeru. Pokud není nastavená, výchozí hodnota
_disable_validation Vyžadováno	bool Před spuštěním odeslání zakažte ověření skriptu. Výchozí hodnota je True.
_show_lint_warnings Vyžadováno	bool Zobrazí upozornění pro lintování skriptu. Výchozí hodnota je False.
_show_package_warnings Vyžadováno	bool Zobrazí upozornění na ověření balíčku. Výchozí hodnota je False.

Váš názor

Byla tato stránka užitečná?

Sdílet prostřednictvím

Estimator Třída

Konstruktor

Parametry

Váš názor