SKLearn Třída

Vytvoří estimátor pro trénování v experimentech Scikit-learn.

ZASTARALÉ. Použijte objekt s ScriptRunConfig vlastním definovaným prostředím nebo AzureML-Tutorial kurátorovaným prostředím. Úvod ke konfiguraci spuštění experimentů SKLearn pomocí ScriptRunConfig najdete v tématu trénování modelů scikit-learn ve velkém s využitím služby Azure Machine Learning.

Tento estimátor podporuje pouze trénování procesoru s jedním uzlem.

Podporované verze: 0.20.3

Inicializujte estimátor Scikit-learn.

Dědičnost
azureml.train.estimator._framework_base_estimator._FrameworkBaseEstimator
SKLearn

Konstruktor

SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)

Parametry

source_directory
str
Vyžadováno

Místní adresář obsahující konfigurační soubory experimentu.

compute_target
AbstractComputeTarget nebo str
Vyžadováno

Cílový výpočetní objekt, ve kterém bude probíhat trénování. Může to být buď objekt, nebo řetězec "local".

vm_size
str
Vyžadováno

Velikost virtuálního počítače cílového výpočetního objektu, který se vytvoří pro trénování.

Podporované hodnoty: Libovolná velikost virtuálního počítače Azure.

vm_priority
str
Vyžadováno

Priorita virtuálního počítače cílového výpočetního objektu, který se vytvoří pro trénování. Pokud není zadáno, použije se "vyhrazené".

Podporované hodnoty: "dedicated" a "lowpriority".

To se projeví pouze v vm_size param případě, že je ve vstupu zadána hodnota .

entry_script
str
Vyžadováno

Řetězec představující relativní cestu k souboru použitému k zahájení trénování.

script_params
dict
Vyžadováno

Slovník argumentů příkazového řádku, které se mají předat vašemu trénovacímu skriptu zadanému v entry_script.

custom_docker_image
str
Vyžadováno

Název image Dockeru, ze které se vytvoří image, která se má použít pro trénování. Pokud není nastavená, jako základní image se použije výchozí image založená na procesoru.

image_registry_details
ContainerRegistry
Vyžadováno

Podrobnosti o registru imagí Dockeru

user_managed
bool
Vyžadováno

Určuje, jestli Azure ML opakovaně používá existující prostředí Pythonu. False znamená, že AzureML vytvoří prostředí Pythonu na základě specifikace závislostí conda.

conda_packages
list
Vyžadováno

Seznam řetězců představujících balíčky conda, které se mají přidat do prostředí Pythonu pro experiment.

pip_packages
list
Vyžadováno

Seznam řetězců představujících balíčky pip, které se mají přidat do prostředí Pythonu pro experiment.

conda_dependencies_file_path
str
Vyžadováno

Řetězec představující relativní cestu k souboru yaml závislostí conda. Pokud je zadáno, Azure ML nenainstaluje žádné balíčky související s architekturou. To je možné poskytnout v kombinaci s parametrem conda_packages . ZASTARALÉ. conda_dependencies_file Použijte parametr .

pip_requirements_file_path
str
Vyžadováno

Řetězec představující relativní cestu k textovému souboru požadavků pip. To je možné poskytnout v kombinaci s parametrem pip_packages . ZASTARALÉ. pip_requirements_file Použijte parametr .

conda_dependencies_file
str
Vyžadováno

Řetězec představující relativní cestu k souboru yaml závislostí conda. Pokud je zadáno, Azure ML nenainstaluje žádné balíčky související s architekturou. To je možné poskytnout v kombinaci s parametrem conda_packages .

pip_requirements_file
str
Vyžadováno

Řetězec představující relativní cestu k textovému souboru požadavků pip. To je možné poskytnout v kombinaci s parametrem pip_packages .

environment_variables
dict
Vyžadováno

Slovník názvů a hodnot proměnných prostředí. Tyto proměnné prostředí se nastavují v procesu, ve kterém se spouští uživatelský skript.

environment_definition
Environment
Vyžadováno

Definice prostředí pro experiment zahrnuje PythonSection, DockerSection a proměnné prostředí. Všechny možnosti prostředí, které nejsou přímo vystaveny prostřednictvím jiných parametrů pro konstrukci estimátoru, lze nastavit pomocí environment_definition parametru. Pokud je tento parametr zadaný, bude mít přednost před jinými parametry souvisejícími s prostředím, jako use_gpujsou , custom_docker_image, conda_packagesnebo pip_packages. Chyby budou hlášeny jako neplatné kombinace.

inputs
list
Vyžadováno

Seznam DataReference objektů nebo DatasetConsumptionConfig objektů, které se mají použít jako vstup.

shm_size
str
Vyžadováno

Velikost bloku sdílené paměti kontejneru Dockeru Pokud není nastavená, použije se výchozí azureml.core.environment._DEFAULT_SHM_SIZE.

resume_from
DataPath
Vyžadováno

Cesta k datům obsahující soubory kontrolního bodu nebo modelu, ze kterých se má experiment pokračovat.

max_run_duration_seconds
int
Vyžadováno

Maximální povolený čas pro spuštění. Azure ML se pokusí automaticky zrušit spuštění, pokud trvá déle, než je tato hodnota.

framework_version
str
Vyžadováno

Verze Scikit-learn, která se má použít ke spouštění trénovacího kódu. SKLearn.get_supported_versions() vrátí seznam verzí podporovaných aktuální sadou SDK.

source_directory
str
Vyžadováno

Místní adresář obsahující konfigurační soubory experimentu.

compute_target
AbstractComputeTarget nebo str
Vyžadováno

Cílový výpočetní objekt, ve kterém bude probíhat trénování. Může to být buď objekt, nebo řetězec "local".

vm_size
str
Vyžadováno

Velikost virtuálního počítače cílového výpočetního objektu, který se vytvoří pro trénování. Podporované hodnoty: Libovolná velikost virtuálního počítače Azure.

vm_priority
str
Vyžadováno

Priorita virtuálního počítače cílového výpočetního objektu, který se vytvoří pro trénování. Pokud není zadáno, použije se "vyhrazené".

Podporované hodnoty: "dedicated" a "lowpriority".

To se projeví pouze v vm_size param případě, že je ve vstupu zadána hodnota .

entry_script
str
Vyžadováno

Řetězec představující relativní cestu k souboru použitému k zahájení trénování.

script_params
dict
Vyžadováno

Slovník argumentů příkazového řádku, které se mají předat vašemu trénovacímu skriptu zadanému v entry_script.

use_docker
bool
Vyžadováno

Logická hodnota označující, jestli by prostředí pro spuštění experimentu mělo být založené na Dockeru.

custom_docker_image
str
Vyžadováno

Název image Dockeru, ze které se vytvoří image, která se má použít pro trénování. Pokud není nastavená, jako základní image se použije výchozí image založená na procesoru.

image_registry_details
ContainerRegistry
Vyžadováno

Podrobnosti o registru imagí Dockeru

user_managed
bool
Vyžadováno

Určuje, jestli Azure ML opakovaně používá existující prostředí Pythonu. False znamená, že AzureML vytvoří prostředí Pythonu na základě specifikace závislostí conda.

conda_packages
list
Vyžadováno

Seznam řetězců představujících balíčky conda, které se mají přidat do prostředí Pythonu pro experiment.

pip_packages
list
Vyžadováno

Seznam řetězců představujících balíčky pip, které se mají přidat do prostředí Pythonu pro experiment.

conda_dependencies_file_path
str
Vyžadováno

Řetězec představující relativní cestu k souboru yaml závislostí conda. Pokud je zadáno, Azure ML nenainstaluje žádné balíčky související s architekturou. To je možné poskytnout v kombinaci s parametrem conda_packages . ZASTARALÉ. conda_dependencies_file Použijte parametr .

pip_requirements_file_path
str
Vyžadováno

Řetězec představující relativní cestu k textovému souboru požadavků pip. To je možné poskytnout v kombinaci s parametrem pip_packages . ZASTARALÉ. pip_requirements_file Použijte parametr .

conda_dependencies_file
str
Vyžadováno

Řetězec představující relativní cestu k souboru yaml závislostí conda. Pokud je zadáno, Azure ML nenainstaluje žádné balíčky související s architekturou. To je možné poskytnout v kombinaci s parametrem conda_packages .

pip_requirements_file
str
Vyžadováno

Řetězec představující relativní cestu k textovému souboru požadavků pip. To je možné poskytnout v kombinaci s parametrem pip_packages .

environment_variables
dict
Vyžadováno

Slovník názvů a hodnot proměnných prostředí. Tyto proměnné prostředí se nastavují v procesu, ve kterém se spouští uživatelský skript.

environment_definition
Environment
Vyžadováno

Definice prostředí pro experiment zahrnuje PythonSection, DockerSection a proměnné prostředí. Všechny možnosti prostředí, které nejsou přímo vystaveny prostřednictvím jiných parametrů pro konstrukci estimátoru, lze nastavit pomocí environment_definition parametru. Pokud je tento parametr zadaný, bude mít přednost před jinými parametry souvisejícími s prostředím, jako use_gpujsou , custom_docker_image, conda_packagesnebo pip_packages. Chyby budou hlášeny jako neplatné kombinace.

inputs
list
Vyžadováno

Seznam azureml.data.data_reference. Objekty DataReference, které se použijí jako vstup.

shm_size
str
Vyžadováno

Velikost bloku sdílené paměti kontejneru Dockeru. Pokud není nastavená, použije se výchozí azureml.core.environment._DEFAULT_SHM_SIZE.

resume_from
DataPath
Vyžadováno

Cesta k datům obsahující kontrolní bod nebo soubory modelu, ze kterých chcete pokračovat v experimentu.

max_run_duration_seconds
int
Vyžadováno

Maximální povolený čas pro spuštění. Azure ML se pokusí automaticky zrušit spuštění, pokud trvá déle než tato hodnota.

framework_version
str
Vyžadováno

Verze Scikit-learn, která se použije ke spouštění trénovacího kódu. SKLearn.get_supported_versions() vrátí seznam verzí podporovaných aktuální sadou SDK.

_enable_optimized_mode
bool
Vyžadováno

Povolte přírůstkové sestavení prostředí s předem sestavenými imagemi architektury pro rychlejší přípravu prostředí. Předem sestavená image architektury je postavená na výchozích imagích procesoru/GPU Azure ML s předinstalovanými závislostmi architektury.

_disable_validation
bool
Vyžadováno

Před spuštěním odeslání zakažte ověřování skriptů. Výchozí hodnota je True.

_show_lint_warnings
bool
Vyžadováno

Zobrazit upozornění na lintování skriptů Výchozí hodnota je Nepravda.

_show_package_warnings
bool
Vyžadováno

Zobrazit upozornění ověření balíčku. Výchozí hodnota je Nepravda.

Poznámky

Při odesílání trénovací úlohy Azure ML spustí váš skript v prostředí conda v rámci kontejneru Dockeru. Kontejnery SKLearn mají nainstalované následující závislosti.

Závislosti | Scikit-learn 0.20.3 | ———————- | —————– | Python | 3.6.2 | azureml-defaults | Nejnovější | IntelMpi | 2018.3.222 | scikit-learn | 0.20.3 | numpy | 1.16.2 | miniconda | 4.5.11 | scipy | 1.2.1 | joblib | 0.13.2 | git | 2.7.4 |

Image Dockeru rozšiřují Ubuntu 16.04.

Pokud potřebujete nainstalovat další závislosti, můžete použít pip_packages parametry nebo conda_packages nebo zadat pip_requirements_file soubor nebo conda_dependencies_file . Alternativně můžete vytvořit vlastní image a předat custom_docker_image parametr konstruktoru estimator.

Atributy

DEFAULT_VERSION

DEFAULT_VERSION = '0.20.3'

FRAMEWORK_NAME

FRAMEWORK_NAME = 'SKLearn'