Sdílet prostřednictvím


SKLearn Třída

Vytvoří estimátor pro trénování v experimentech Scikit-learn.

ZAVRHOVANÝ. ScriptRunConfig Použijte objekt s vlastním definovaným prostředím nebo AzureML-Tutorial kurátorovaným prostředím. Úvod ke konfiguraci experimentů SKLearn pomocí ScriptRunConfig najdete v tématu Trénování modelů scikit-learn ve velkém měřítku pomocí služby Azure Machine Learning.

Tento estimátor podporuje pouze trénování procesoru s jedním uzlem.

Podporované verze: 0.20.3

Inicializace estimátoru Scikit-learn

Konstruktor

SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)

Parametry

Name Description
source_directory
Vyžadováno
str

Místní adresář obsahující konfigurační soubory experimentu.

compute_target
Vyžadováno

Cílový výpočetní objekt, ve kterém bude trénování probíhat. Může to být buď objekt, nebo řetězec "local".

vm_size
Vyžadováno
str

Velikost virtuálního počítače cílového výpočetního objektu, který se vytvoří pro trénování.

Podporované hodnoty: Libovolná velikost virtuálního počítače Azure

vm_priority
Vyžadováno
str

Priorita virtuálního počítače cílového výpočetního objektu, který se vytvoří pro trénování. Pokud není zadáno, použije se "dedicated".

Podporované hodnoty: "dedicated" a "lowpriority".

To se projeví pouze v případě, vm_size param že je zadaný ve vstupu.

entry_script
Vyžadováno
str

Řetězec představující relativní cestu k souboru použitému k zahájení trénování.

script_params
Vyžadováno

Slovník argumentů příkazového řádku, který se má předat trénovacímu skriptu zadanému v entry_script.

custom_docker_image
Vyžadováno
str

Vytvoří se název image Dockeru, ze které se má image použít pro trénování. Pokud není nastavená, jako základní image se použije výchozí image založená na procesoru.

image_registry_details
Vyžadováno

Podrobnosti registru imagí Dockeru

user_managed
Vyžadováno

Určuje, jestli Azure ML znovu používá existující prostředí Pythonu. False znamená, že AzureML vytvoří prostředí Pythonu na základě specifikace závislostí conda.

conda_packages
Vyžadováno

Seznam řetězců představujících balíčky conda, které se mají přidat do prostředí Pythonu pro experiment.

pip_packages
Vyžadováno

Seznam řetězců představujících balíčky pip, které se mají přidat do prostředí Pythonu pro experiment.

conda_dependencies_file_path
Vyžadováno
str

Řetězec představující relativní cestu k souboru yaml závislostí conda. Pokud je zadáno, Azure ML nenainstaluje žádné balíčky související s architekturou. Dá se zadat v kombinaci s parametrem conda_packages . ZAVRHOVANÝ. conda_dependencies_file Použijte parametr.

pip_requirements_file_path
Vyžadováno
str

Řetězec představující relativní cestu k textovému souboru požadavků pip. Dá se zadat v kombinaci s parametrem pip_packages . ZAVRHOVANÝ. pip_requirements_file Použijte parametr.

conda_dependencies_file
Vyžadováno
str

Řetězec představující relativní cestu k souboru yaml závislostí conda. Pokud je zadáno, Azure ML nenainstaluje žádné balíčky související s architekturou. Dá se zadat v kombinaci s parametrem conda_packages .

pip_requirements_file
Vyžadováno
str

Řetězec představující relativní cestu k textovému souboru požadavků pip. Dá se zadat v kombinaci s parametrem pip_packages .

environment_variables
Vyžadováno

Slovník názvů a hodnot proměnných prostředí Tyto proměnné prostředí jsou nastavené v procesu, ve kterém se spouští uživatelský skript.

environment_definition
Vyžadováno

Definice prostředí pro experiment zahrnuje PythonSection, DockerSection a proměnné prostředí. Pomocí parametru lze nastavit environment_definition jakoukoli možnost prostředí, která není přímo zpřístupněna prostřednictvím jiných parametrů pro konstrukci odhadce. Pokud je tento parametr zadán, bude mít přednost před jinými parametry souvisejícími s prostředím, jako je use_gpu, custom_docker_image, conda_packagesnebo pip_packages. Chyby budou hlášeny neplatné kombinace.

inputs
Vyžadováno

Seznam DataReference objektů nebo DatasetConsumptionConfig objektů, které se mají použít jako vstup.

shm_size
Vyžadováno
str

Velikost bloku sdílené paměti kontejneru Dockeru. Pokud není nastavená, použije se výchozí azureml.core.environment._DEFAULT_SHM_SIZE.

resume_from
Vyžadováno

Cesta k datům obsahující soubory kontrolního bodu nebo modelu, ze kterých chcete experiment obnovit.

max_run_duration_seconds
Vyžadováno
int

Maximální povolená doba běhu. Azure ML se pokusí spuštění automaticky zrušit, pokud trvá déle, než je tato hodnota.

framework_version
Vyžadováno
str

Verze Scikit-learn, která se má použít ke spouštění trénovacího kódu. SKLearn.get_supported_versions() vrátí seznam verzí podporovaných aktuální sadou SDK.

source_directory
Vyžadováno
str

Místní adresář obsahující konfigurační soubory experimentu.

compute_target
Vyžadováno

Cílový výpočetní objekt, ve kterém bude trénování probíhat. Může to být buď objekt, nebo řetězec "local".

vm_size
Vyžadováno
str

Velikost virtuálního počítače cílového výpočetního objektu, který se vytvoří pro trénování. Podporované hodnoty: Libovolná velikost virtuálního počítače Azure

vm_priority
Vyžadováno
str

Priorita virtuálního počítače cílového výpočetního objektu, který se vytvoří pro trénování. Pokud není zadáno, použije se "dedicated".

Podporované hodnoty: "dedicated" a "lowpriority".

To se projeví pouze v případě, vm_size param že je zadaný ve vstupu.

entry_script
Vyžadováno
str

Řetězec představující relativní cestu k souboru použitému k zahájení trénování.

script_params
Vyžadováno

Slovník argumentů příkazového řádku, který se má předat trénovacímu skriptu zadanému v entry_script.

use_docker
Vyžadováno

Logická hodnota označující, jestli má být prostředí ke spuštění experimentu založené na Dockeru.

custom_docker_image
Vyžadováno
str

Vytvoří se název image Dockeru, ze které se má image použít pro trénování. Pokud není nastavená, jako základní image se použije výchozí image založená na procesoru.

image_registry_details
Vyžadováno

Podrobnosti registru imagí Dockeru

user_managed
Vyžadováno

Určuje, jestli Azure ML znovu používá existující prostředí Pythonu. False znamená, že AzureML vytvoří prostředí Pythonu na základě specifikace závislostí conda.

conda_packages
Vyžadováno

Seznam řetězců představujících balíčky conda, které se mají přidat do prostředí Pythonu pro experiment.

pip_packages
Vyžadováno

Seznam řetězců představujících balíčky pip, které se mají přidat do prostředí Pythonu pro experiment.

conda_dependencies_file_path
Vyžadováno
str

Řetězec představující relativní cestu k souboru yaml závislostí conda. Pokud je zadáno, Azure ML nenainstaluje žádné balíčky související s architekturou. Dá se zadat v kombinaci s parametrem conda_packages . ZAVRHOVANÝ. conda_dependencies_file Použijte parametr.

pip_requirements_file_path
Vyžadováno
str

Řetězec představující relativní cestu k textovému souboru požadavků pip. Dá se zadat v kombinaci s parametrem pip_packages . ZAVRHOVANÝ. pip_requirements_file Použijte parametr.

conda_dependencies_file
Vyžadováno
str

Řetězec představující relativní cestu k souboru yaml závislostí conda. Pokud je zadáno, Azure ML nenainstaluje žádné balíčky související s architekturou. Dá se zadat v kombinaci s parametrem conda_packages .

pip_requirements_file
Vyžadováno
str

Řetězec představující relativní cestu k textovému souboru požadavků pip. Dá se zadat v kombinaci s parametrem pip_packages .

environment_variables
Vyžadováno

Slovník názvů a hodnot proměnných prostředí Tyto proměnné prostředí jsou nastavené v procesu, ve kterém se spouští uživatelský skript.

environment_definition
Vyžadováno

Definice prostředí pro experiment zahrnuje PythonSection, DockerSection a proměnné prostředí. Pomocí parametru lze nastavit environment_definition jakoukoli možnost prostředí, která není přímo zpřístupněna prostřednictvím jiných parametrů pro konstrukci odhadce. Pokud je tento parametr zadán, bude mít přednost před jinými parametry souvisejícími s prostředím, jako je use_gpu, custom_docker_image, conda_packagesnebo pip_packages. Chyby budou hlášeny neplatné kombinace.

inputs
Vyžadováno

Seznam azureml.data.data_reference Objekty DataReference, které se mají použít jako vstup.

shm_size
Vyžadováno
str

Velikost bloku sdílené paměti kontejneru Dockeru. Pokud není nastavená, použije se výchozí azureml.core.environment._DEFAULT_SHM_SIZE.

resume_from
Vyžadováno

Cesta k datům obsahující soubory kontrolního bodu nebo modelu, ze kterých chcete experiment obnovit.

max_run_duration_seconds
Vyžadováno
int

Maximální povolená doba běhu. Azure ML se pokusí spuštění automaticky zrušit, pokud trvá déle, než je tato hodnota.

framework_version
Vyžadováno
str

Verze Scikit-learn, která se má použít ke spouštění trénovacího kódu. SKLearn.get_supported_versions() vrátí seznam verzí podporovaných aktuální sadou SDK.

_enable_optimized_mode
Vyžadováno

Povolte přírůstkové sestavení prostředí s předem sestavenými imagemi architektury pro rychlejší přípravu prostředí. Předem sestavená image architektury je postavená na výchozích imagích procesoru a GPU Azure ML s předinstalovanými závislostmi architektury.

_disable_validation
Vyžadováno

Před spuštěním odeslání zakažte ověření skriptu. Výchozí hodnota je True.

_show_lint_warnings
Vyžadováno

Zobrazí upozornění pro lintování skriptu. Výchozí hodnota je False.

_show_package_warnings
Vyžadováno

Zobrazí upozornění na ověření balíčku. Výchozí hodnota je False.

Poznámky

Při odesílání trénovací úlohy spustí Azure ML skript v prostředí Conda v kontejneru Dockeru. Kontejnery SKLearn mají nainstalované následující závislosti.

Závislosti | Scikit-learn 0.20.3 | ———————- | —————– | Python | 3.6.2 | výchozí hodnoty azureml | Nejnovější | IntelMpi | 2018.3.222 | scikit-learn | 0.20.3 | numpy | 1.16.2 | miniconda | 4.5.11 | scipy | 1.2.1 | joblib | 0.13.2 | git | 2.7.4 |

Image Dockeru rozšiřují Ubuntu 16.04.

Pokud potřebujete nainstalovat další závislosti, můžete použít pip_packagesconda_packages buď parametry, nebo můžete zadat soubor pip_requirements_file nebo conda_dependencies_file soubor. Alternativně můžete vytvořit vlastní image a předat custom_docker_image parametr konstruktoru estimátoru.

Atributy

DEFAULT_VERSION

DEFAULT_VERSION = '0.20.3'

FRAMEWORK_NAME

FRAMEWORK_NAME = 'SKLearn'