Sdílet prostřednictvím


Estimator Třída

Představuje obecný estimátor pro trénování dat pomocí libovolné zadané architektury.

ZAVRHOVANÝ. ScriptRunConfig Použijte objekt s vlastním definovaným prostředím nebo kurátorovaným prostředím Azure ML. Úvod ke konfiguraci spuštění experimentů pomocí ScriptRunConfig najdete v tématu Konfigurace a odeslání trénovacích běhů.

Tato třída je určená pro použití s architekturami strojového učení, které ještě nemají předem nakonfigurovaný estimátor služby Azure Machine Learning. Předkonfigurované estimátory existují pro Chainer, PyTorch, TensorFlowa SKLearn. Pokud chcete vytvořit estimátor, který není předkonfigurovaný, přečtěte si téma Trénování modelů pomocí nástroje estimator.

Třída estimátoru zabalí informace o spuštění konfigurace, aby zjednodušila úlohy určení způsobu spuštění skriptu. Podporuje spouštění s jedním uzlem i více uzlů. Spuštění estimátoru vytvoří model ve výstupním adresáři zadaném ve vašem trénovacím skriptu.

Inicializuje estimátor.

azureml.core.environment._DEFAULT_SHM_SIZE se používá. Další informace najdete v referenčních informacích ke spuštění Dockeru. :type shm_size: str :p aram resume_from: Datová cesta obsahující kontrolní bod nebo soubory modelu, ze kterých chcete experiment obnovit. :type resume_from: azureml.datapath.DataPath :p aram max_run_duration_seconds: Maximální povolený čas spuštění. Azure ML se pokusí automaticky

zrušte spuštění, pokud trvá déle, než je tato hodnota.

Konstruktor

Estimator(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, node_count=1, process_count_per_node=1, distributed_backend=None, distributed_training=None, use_gpu=False, use_docker=True, custom_docker_base_image=None, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, source_directory_data_store=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)

Parametry

Name Description
source_directory
Vyžadováno
str

Místní adresář obsahující soubory konfigurace experimentu a kódu potřebné pro trénovací úlohu.

compute_target
Vyžadováno

Cílový výpočetní objekt, ve kterém bude trénování probíhat. Může to být buď objekt, nebo řetězec "local".

vm_size
Vyžadováno
str

Velikost virtuálního počítače cílového výpočetního objektu, který se vytvoří pro trénování. Podporované hodnoty: Libovolná velikost virtuálního počítače Azure

vm_priority
Vyžadováno
str

Priorita virtuálního počítače cílového výpočetního objektu, který se vytvoří pro trénování. Pokud není zadáno, použije se "dedicated".

Podporované hodnoty: "dedicated" a "lowpriority".

To se projeví pouze v případě, vm_size že je parametr zadaný ve vstupu.

entry_script
Vyžadováno
str

Relativní cesta k souboru použitému k zahájení trénování.

script_params
Vyžadováno

Slovník argumentů příkazového řádku, který se má předat trénovacímu skriptu zadanému v entry_script.

node_count
Vyžadováno
int

Početuzlůch Pokud je větší než 1, spustí se distribuovaná úloha MPI.

process_count_per_node
Vyžadováno
int

Počet procesů (neboli pracovních procesů), které se mají spustit na každém uzlu. Pokud je větší než 1, spustí se distribuovaná úloha MPI. Distribuovaných AmlCompute úloh je podporován pouze cíl.

distributed_backend
Vyžadováno
str

Back-end komunikace pro distribuované trénování.

ZAVRHOVANÝ. distributed_training Použijte parametr.

Podporované hodnoty: mpi. Mpi představuje MPI/Horovod.

Tento parametr je povinný, pokud node_count nebo process_count_per_node> 1.

Pokud node_count == 1 a process_count_per_node == 1, nebude použit žádný back-end, pokud není back-end explicitně nastaven. AmlCompute Pro distribuované trénování se podporuje jenom cíl.

distributed_training
Vyžadováno
Mpi

Parametry pro spuštění distribuované trénovací úlohy

Pro spuštění distribuované úlohy s back-endem MPI použijte Mpi objekt k určení process_count_per_node.

use_gpu
Vyžadováno

Určuje, jestli má prostředí pro spuštění experimentu podporovat gpu. Pokud ano, použije se v prostředí výchozí image Dockeru založená na GPU. Pokud je false, použije se image založená na procesoru. Výchozí image Dockeru (CPU nebo GPU) se použijí jenom v případě, že custom_docker_image parametr není nastavený. Toto nastavení se používá jenom v cílových výpočetních objektech s podporou Dockeru.

use_docker
Vyžadováno

Určuje, jestli má být prostředí ke spuštění experimentu založené na Dockeru.

custom_docker_base_image
Vyžadováno
str

Vytvoří se název image Dockeru, ze které se má image použít pro trénování.

ZAVRHOVANÝ. custom_docker_image Použijte parametr.

Pokud není nastavená, jako základní image se použije výchozí image založená na procesoru.

custom_docker_image
Vyžadováno
str

Vytvoří se název image Dockeru, ze které se má image použít pro trénování. Pokud není nastavená, jako základní image se použije výchozí image založená na procesoru. Zadejte pouze image dostupné ve veřejných úložištích Dockeru (Docker Hub). Pokud chcete použít image z privátního úložiště Dockeru, použijte místo toho parametr konstruktoru environment_definition .

image_registry_details
Vyžadováno

Podrobnosti registru imagí Dockeru

user_managed
Vyžadováno

Určuje, jestli Azure ML znovu používá existující prostředí Pythonu. Pokud je false, vytvoří se prostředí Pythonu na základě specifikace závislostí conda.

conda_packages
Vyžadováno

Seznam řetězců představujících balíčky conda, které se mají přidat do prostředí Pythonu pro experiment.

pip_packages
Vyžadováno

Seznam řetězců představujících balíčky pip, které se mají přidat do prostředí Pythonu pro experiment.

conda_dependencies_file_path
Vyžadováno
str

Relativní cesta k souboru yaml závislostí conda. Pokud je zadáno, Azure ML nenainstaluje žádné balíčky související s architekturou.

ZAVRHOVANÝ. conda_dependencies_file Použijte paramenter.

Zadejte buď conda_dependencies_file_path nebo conda_dependencies_file. Pokud jsou zadány obě, conda_dependencies_file použije se.

pip_requirements_file_path
Vyžadováno
str

Relativní cesta k textovému souboru požadavků pip.

ZAVRHOVANÝ. pip_requirements_file Použijte parametr.

Tento parametr lze zadat v kombinaci s parametrem pip_packages . Zadejte buď pip_requirements_file_path nebo pip_requirements_file. Pokud jsou zadány obě, pip_requirements_file použije se.

conda_dependencies_file
Vyžadováno
str

Relativní cesta k souboru yaml závislostí conda. Pokud je zadáno, Azure ML nenainstaluje žádné balíčky související s architekturou.

pip_requirements_file
Vyžadováno
str

Relativní cesta k textovému souboru požadavků pip. Tento parametr lze zadat v kombinaci s parametrem pip_packages .

environment_variables
Vyžadováno

Slovník názvů a hodnot proměnných prostředí Tyto proměnné prostředí jsou nastavené v procesu, ve kterém se spouští uživatelský skript.

environment_definition
Vyžadováno

Definice prostředí pro experiment. Zahrnuje PythonSection, DockerSection a proměnné prostředí. Pomocí tohoto parametru lze nastavit jakoukoli možnost prostředí, která není přímo zpřístupněna prostřednictvím jiných parametrů pro konstrukci odhadce. Pokud je tento parametr zadán, bude mít přednost před jinými parametry souvisejícími s prostředím, jako je use_gpu, custom_docker_image, conda_packagesnebo pip_packages. Chyby budou hlášeny v neplatných kombinacích.

inputs
Vyžadováno

Seznam DataReference objektů nebo DatasetConsumptionConfig objektů, které se mají použít jako vstup.

source_directory_data_store
Vyžadováno

Záložní úložiště dat pro sdílenou složku projektu.

shm_size
Vyžadováno
str

Velikost bloku sdílené paměti kontejneru Dockeru. Pokud není nastavená, použije se výchozí azureml.core.environment._DEFAULT_SHM_SIZE. Další informace najdete v referenčních informacích ke spuštění Dockeru.

resume_from
Vyžadováno

Cesta k datům obsahující soubory kontrolního bodu nebo modelu, ze kterých chcete experiment obnovit.

max_run_duration_seconds
Vyžadováno
int

Maximální povolená doba běhu. Azure ML se pokusí spuštění automaticky zrušit, pokud trvá déle, než je tato hodnota.

source_directory
Vyžadováno
str

Místní adresář obsahující soubory konfigurace experimentu a kódu potřebné pro trénovací úlohu.

compute_target
Vyžadováno

Cílový výpočetní objekt, ve kterém bude trénování probíhat. Může to být buď objekt, nebo řetězec "local".

vm_size
Vyžadováno
str

Velikost virtuálního počítače cílového výpočetního objektu, který se vytvoří pro trénování. Podporované hodnoty: Libovolná velikost virtuálního počítače Azure

vm_priority
Vyžadováno
str

Priorita virtuálního počítače cílového výpočetního objektu, který se vytvoří pro trénování. Pokud není zadáno, použije se "dedicated".

Podporované hodnoty: "dedicated" a "lowpriority".

To se projeví pouze v případě, vm_size že je parametr zadaný ve vstupu.

entry_script
Vyžadováno
str

Relativní cesta k souboru použitému k zahájení trénování.

script_params
Vyžadováno

Slovník argumentů příkazového řádku, který se má předat trénovacímu skriptu zadanému v entry_script.

node_count
Vyžadováno
int

Početuzlůch Pokud je větší než 1, spustí se distribuovaná úloha MPI. Distribuovaných AmlCompute úloh je podporován pouze cíl.

process_count_per_node
Vyžadováno
int

Počet procesů na uzel. Pokud je větší než 1, spustí se distribuovaná úloha MPI. Distribuovaných AmlCompute úloh je podporován pouze cíl.

distributed_backend
Vyžadováno
str

Back-end komunikace pro distribuované trénování.

ZAVRHOVANÝ. distributed_training Použijte parametr.

Podporované hodnoty: mpi. Mpi představuje MPI/Horovod.

Tento parametr je povinný, pokud node_count nebo process_count_per_node> 1.

Pokud node_count == 1 a process_count_per_node == 1, nebude použit žádný back-end, pokud není back-end explicitně nastaven. AmlCompute Pro distribuované trénování se podporuje jenom cíl.

distributed_training
Vyžadováno
Mpi

Parametry pro spuštění distribuované trénovací úlohy

Pro spuštění distribuované úlohy s back-endem MPI použijte Mpi objekt k určení process_count_per_node.

use_gpu
Vyžadováno

Určuje, jestli má prostředí pro spuštění experimentu podporovat gpu. Pokud ano, použije se v prostředí výchozí image Dockeru založená na GPU. Pokud je false, použije se image založená na procesoru. Výchozí image Dockeru (CPU nebo GPU) se použijí jenom v případě, že custom_docker_image parametr není nastavený. Toto nastavení se používá jenom v cílových výpočetních objektech s podporou Dockeru.

use_docker
Vyžadováno

Určuje, jestli má být prostředí ke spuštění experimentu založené na Dockeru.

custom_docker_base_image
Vyžadováno
str

Vytvoří se název image Dockeru, ze které se má image použít pro trénování.

ZAVRHOVANÝ. custom_docker_image Použijte parametr.

Pokud není nastavená, jako základní image se použije výchozí image založená na procesoru.

custom_docker_image
Vyžadováno
str

Vytvoří se název image Dockeru, ze které se má image použít pro trénování. Pokud není nastavená, jako základní image se použije výchozí image založená na procesoru. Zadejte pouze image dostupné ve veřejných úložištích Dockeru (Docker Hub). Pokud chcete použít image z privátního úložiště Dockeru, použijte místo toho parametr konstruktoru environment_definition .

image_registry_details
Vyžadováno

Podrobnosti registru imagí Dockeru

user_managed
Vyžadováno

Určuje, jestli Azure ML znovu používá existující prostředí Pythonu. Pokud je false, vytvoří se prostředí Pythonu na základě specifikace závislostí conda.

conda_packages
Vyžadováno

Seznam řetězců představujících balíčky conda, které se mají přidat do prostředí Pythonu pro experiment.

pip_packages
Vyžadováno

Seznam řetězců představujících balíčky pip, které se mají přidat do prostředí Pythonu pro experiment.

conda_dependencies_file_path
Vyžadováno

Relativní cesta k souboru yaml závislostí conda. Pokud je zadáno, Azure ML nenainstaluje žádné balíčky související s architekturou.

ZAVRHOVANÝ. conda_dependencies_file Použijte paramenter.

Zadejte buď conda_dependencies_file_path nebo conda_dependencies_file. Pokud jsou zadány obě, conda_dependencies_file použije se.

pip_requirements_file_path
Vyžadováno

Relativní cesta k textovému souboru požadavků pip.

ZAVRHOVANÝ. pip_requirements_file Použijte parametr.

Dá se zadat v kombinaci s parametrem pip_packages . Zadejte buď pip_requirements_file_path nebo pip_requirements_file. Pokud jsou zadány obě, pip_requirements_file použije se.

pip_requirements_file
Vyžadováno
str

Relativní cesta k textovému souboru požadavků pip. Dá se zadat v kombinaci s parametrem pip_packages .

environment_variables
Vyžadováno

Slovník názvů a hodnot proměnných prostředí Tyto proměnné prostředí jsou nastavené v procesu, ve kterém se spouští uživatelský skript.

environment_definition
Vyžadováno

Definice prostředí pro experiment. Zahrnuje PythonSection, DockerSection a proměnné prostředí. Pomocí tohoto parametru lze nastavit jakoukoli možnost prostředí, která není přímo zpřístupněna prostřednictvím jiných parametrů pro konstrukci odhadce. Pokud je tento parametr zadán, bude mít přednost před jinými parametry souvisejícími s prostředím, jako je use_gpu, custom_docker_image, conda_packagesnebo pip_packages. Chyby budou hlášeny v neplatných kombinacích.

inputs
Vyžadováno

Seznam DataReference objektů nebo DatasetConsumptionConfig objektů, které se mají použít jako vstup.

source_directory_data_store
Vyžadováno

Záložní úložiště dat pro sdílenou složku projektu.

shm_size
Vyžadováno

Velikost bloku sdílené paměti kontejneru Dockeru. Pokud není nastavená, výchozí hodnota

_disable_validation
Vyžadováno

Před spuštěním odeslání zakažte ověření skriptu. Výchozí hodnota je True.

_show_lint_warnings
Vyžadováno

Zobrazí upozornění pro lintování skriptu. Výchozí hodnota je False.

_show_package_warnings
Vyžadováno

Zobrazí upozornění na ověření balíčku. Výchozí hodnota je False.