SKLearn Třída
Vytvoří estimátor pro trénování v experimentech Scikit-learn.
ZAVRHOVANÝ. ScriptRunConfig Použijte objekt s vlastním definovaným prostředím nebo AzureML-Tutorial kurátorovaným prostředím. Úvod ke konfiguraci experimentů SKLearn pomocí ScriptRunConfig najdete v tématu Trénování modelů scikit-learn ve velkém měřítku pomocí služby Azure Machine Learning.
Tento estimátor podporuje pouze trénování procesoru s jedním uzlem.
Podporované verze: 0.20.3
Inicializace estimátoru Scikit-learn
Konstruktor
SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)
Parametry
| Name | Description |
|---|---|
|
source_directory
Vyžadováno
|
Místní adresář obsahující konfigurační soubory experimentu. |
|
compute_target
Vyžadováno
|
AbstractComputeTarget nebo
str
Cílový výpočetní objekt, ve kterém bude trénování probíhat. Může to být buď objekt, nebo řetězec "local". |
|
vm_size
Vyžadováno
|
Velikost virtuálního počítače cílového výpočetního objektu, který se vytvoří pro trénování. Podporované hodnoty: Libovolná velikost virtuálního počítače Azure |
|
vm_priority
Vyžadováno
|
Priorita virtuálního počítače cílového výpočetního objektu, který se vytvoří pro trénování. Pokud není zadáno, použije se "dedicated". Podporované hodnoty: "dedicated" a "lowpriority". To se projeví pouze v případě, |
|
entry_script
Vyžadováno
|
Řetězec představující relativní cestu k souboru použitému k zahájení trénování. |
|
script_params
Vyžadováno
|
Slovník argumentů příkazového řádku, který se má předat trénovacímu skriptu zadanému v |
|
custom_docker_image
Vyžadováno
|
Vytvoří se název image Dockeru, ze které se má image použít pro trénování. Pokud není nastavená, jako základní image se použije výchozí image založená na procesoru. |
|
image_registry_details
Vyžadováno
|
Podrobnosti registru imagí Dockeru |
|
user_managed
Vyžadováno
|
Určuje, jestli Azure ML znovu používá existující prostředí Pythonu. False znamená, že AzureML vytvoří prostředí Pythonu na základě specifikace závislostí conda. |
|
conda_packages
Vyžadováno
|
Seznam řetězců představujících balíčky conda, které se mají přidat do prostředí Pythonu pro experiment. |
|
pip_packages
Vyžadováno
|
Seznam řetězců představujících balíčky pip, které se mají přidat do prostředí Pythonu pro experiment. |
|
conda_dependencies_file_path
Vyžadováno
|
Řetězec představující relativní cestu k souboru yaml závislostí conda.
Pokud je zadáno, Azure ML nenainstaluje žádné balíčky související s architekturou.
Dá se zadat v kombinaci s parametrem |
|
pip_requirements_file_path
Vyžadováno
|
Řetězec představující relativní cestu k textovému souboru požadavků pip.
Dá se zadat v kombinaci s parametrem |
|
conda_dependencies_file
Vyžadováno
|
Řetězec představující relativní cestu k souboru yaml závislostí conda.
Pokud je zadáno, Azure ML nenainstaluje žádné balíčky související s architekturou.
Dá se zadat v kombinaci s parametrem |
|
pip_requirements_file
Vyžadováno
|
Řetězec představující relativní cestu k textovému souboru požadavků pip.
Dá se zadat v kombinaci s parametrem |
|
environment_variables
Vyžadováno
|
Slovník názvů a hodnot proměnných prostředí Tyto proměnné prostředí jsou nastavené v procesu, ve kterém se spouští uživatelský skript. |
|
environment_definition
Vyžadováno
|
Definice prostředí pro experiment zahrnuje PythonSection, DockerSection a proměnné prostředí. Pomocí parametru lze nastavit |
|
inputs
Vyžadováno
|
Seznam DataReference objektů nebo DatasetConsumptionConfig objektů, které se mají použít jako vstup. |
|
shm_size
Vyžadováno
|
Velikost bloku sdílené paměti kontejneru Dockeru. Pokud není nastavená, použije se výchozí azureml.core.environment._DEFAULT_SHM_SIZE. |
|
resume_from
Vyžadováno
|
Cesta k datům obsahující soubory kontrolního bodu nebo modelu, ze kterých chcete experiment obnovit. |
|
max_run_duration_seconds
Vyžadováno
|
Maximální povolená doba běhu. Azure ML se pokusí spuštění automaticky zrušit, pokud trvá déle, než je tato hodnota. |
|
framework_version
Vyžadováno
|
Verze Scikit-learn, která se má použít ke spouštění trénovacího kódu.
|
|
source_directory
Vyžadováno
|
Místní adresář obsahující konfigurační soubory experimentu. |
|
compute_target
Vyžadováno
|
AbstractComputeTarget nebo
str
Cílový výpočetní objekt, ve kterém bude trénování probíhat. Může to být buď objekt, nebo řetězec "local". |
|
vm_size
Vyžadováno
|
Velikost virtuálního počítače cílového výpočetního objektu, který se vytvoří pro trénování. Podporované hodnoty: Libovolná velikost virtuálního počítače Azure |
|
vm_priority
Vyžadováno
|
Priorita virtuálního počítače cílového výpočetního objektu, který se vytvoří pro trénování. Pokud není zadáno, použije se "dedicated". Podporované hodnoty: "dedicated" a "lowpriority". To se projeví pouze v případě, |
|
entry_script
Vyžadováno
|
Řetězec představující relativní cestu k souboru použitému k zahájení trénování. |
|
script_params
Vyžadováno
|
Slovník argumentů příkazového řádku, který se má předat trénovacímu skriptu zadanému v |
|
use_docker
Vyžadováno
|
Logická hodnota označující, jestli má být prostředí ke spuštění experimentu založené na Dockeru. |
|
custom_docker_image
Vyžadováno
|
Vytvoří se název image Dockeru, ze které se má image použít pro trénování. Pokud není nastavená, jako základní image se použije výchozí image založená na procesoru. |
|
image_registry_details
Vyžadováno
|
Podrobnosti registru imagí Dockeru |
|
user_managed
Vyžadováno
|
Určuje, jestli Azure ML znovu používá existující prostředí Pythonu. False znamená, že AzureML vytvoří prostředí Pythonu na základě specifikace závislostí conda. |
|
conda_packages
Vyžadováno
|
Seznam řetězců představujících balíčky conda, které se mají přidat do prostředí Pythonu pro experiment. |
|
pip_packages
Vyžadováno
|
Seznam řetězců představujících balíčky pip, které se mají přidat do prostředí Pythonu pro experiment. |
|
conda_dependencies_file_path
Vyžadováno
|
Řetězec představující relativní cestu k souboru yaml závislostí conda. Pokud je zadáno, Azure ML nenainstaluje žádné balíčky související s architekturou.
Dá se zadat v kombinaci s parametrem |
|
pip_requirements_file_path
Vyžadováno
|
Řetězec představující relativní cestu k textovému souboru požadavků pip.
Dá se zadat v kombinaci s parametrem |
|
conda_dependencies_file
Vyžadováno
|
Řetězec představující relativní cestu k souboru yaml závislostí conda. Pokud je zadáno, Azure ML nenainstaluje žádné balíčky související s architekturou.
Dá se zadat v kombinaci s parametrem |
|
pip_requirements_file
Vyžadováno
|
Řetězec představující relativní cestu k textovému souboru požadavků pip.
Dá se zadat v kombinaci s parametrem |
|
environment_variables
Vyžadováno
|
Slovník názvů a hodnot proměnných prostředí Tyto proměnné prostředí jsou nastavené v procesu, ve kterém se spouští uživatelský skript. |
|
environment_definition
Vyžadováno
|
Definice prostředí pro experiment zahrnuje PythonSection, DockerSection a proměnné prostředí. Pomocí parametru lze nastavit |
|
inputs
Vyžadováno
|
Seznam azureml.data.data_reference Objekty DataReference, které se mají použít jako vstup. |
|
shm_size
Vyžadováno
|
Velikost bloku sdílené paměti kontejneru Dockeru. Pokud není nastavená, použije se výchozí azureml.core.environment._DEFAULT_SHM_SIZE. |
|
resume_from
Vyžadováno
|
Cesta k datům obsahující soubory kontrolního bodu nebo modelu, ze kterých chcete experiment obnovit. |
|
max_run_duration_seconds
Vyžadováno
|
Maximální povolená doba běhu. Azure ML se pokusí spuštění automaticky zrušit, pokud trvá déle, než je tato hodnota. |
|
framework_version
Vyžadováno
|
Verze Scikit-learn, která se má použít ke spouštění trénovacího kódu.
|
|
_enable_optimized_mode
Vyžadováno
|
Povolte přírůstkové sestavení prostředí s předem sestavenými imagemi architektury pro rychlejší přípravu prostředí. Předem sestavená image architektury je postavená na výchozích imagích procesoru a GPU Azure ML s předinstalovanými závislostmi architektury. |
|
_disable_validation
Vyžadováno
|
Před spuštěním odeslání zakažte ověření skriptu. Výchozí hodnota je True. |
|
_show_lint_warnings
Vyžadováno
|
Zobrazí upozornění pro lintování skriptu. Výchozí hodnota je False. |
|
_show_package_warnings
Vyžadováno
|
Zobrazí upozornění na ověření balíčku. Výchozí hodnota je False. |
Poznámky
Při odesílání trénovací úlohy spustí Azure ML skript v prostředí Conda v kontejneru Dockeru. Kontejnery SKLearn mají nainstalované následující závislosti.
Závislosti | Scikit-learn 0.20.3 | ———————- | —————– | Python | 3.6.2 | výchozí hodnoty azureml | Nejnovější | IntelMpi | 2018.3.222 | scikit-learn | 0.20.3 | numpy | 1.16.2 | miniconda | 4.5.11 | scipy | 1.2.1 | joblib | 0.13.2 | git | 2.7.4 |
Image Dockeru rozšiřují Ubuntu 16.04.
Pokud potřebujete nainstalovat další závislosti, můžete použít pip_packagesconda_packages buď parametry, nebo můžete zadat soubor pip_requirements_file nebo conda_dependencies_file soubor. Alternativně můžete vytvořit vlastní image a předat custom_docker_image parametr konstruktoru estimátoru.
Atributy
DEFAULT_VERSION
DEFAULT_VERSION = '0.20.3'
FRAMEWORK_NAME
FRAMEWORK_NAME = 'SKLearn'