SKLearn Třída
Vytvoří estimátor pro trénování v experimentech Scikit-learn.
ZASTARALÉ. Použijte objekt s ScriptRunConfig vlastním definovaným prostředím nebo AzureML-Tutorial kurátorovaným prostředím. Úvod ke konfiguraci spuštění experimentů SKLearn pomocí ScriptRunConfig najdete v tématu trénování modelů scikit-learn ve velkém s využitím služby Azure Machine Learning.
Tento estimátor podporuje pouze trénování procesoru s jedním uzlem.
Podporované verze: 0.20.3
Inicializujte estimátor Scikit-learn.
- Dědičnost
-
azureml.train.estimator._framework_base_estimator._FrameworkBaseEstimatorSKLearn
Konstruktor
SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)
Parametry
- compute_target
- AbstractComputeTarget nebo str
Cílový výpočetní objekt, ve kterém bude probíhat trénování. Může to být buď objekt, nebo řetězec "local".
- vm_size
- str
Velikost virtuálního počítače cílového výpočetního objektu, který se vytvoří pro trénování.
Podporované hodnoty: Libovolná velikost virtuálního počítače Azure.
- vm_priority
- str
Priorita virtuálního počítače cílového výpočetního objektu, který se vytvoří pro trénování. Pokud není zadáno, použije se "vyhrazené".
Podporované hodnoty: "dedicated" a "lowpriority".
To se projeví pouze v vm_size param
případě, že je ve vstupu zadána hodnota .
- entry_script
- str
Řetězec představující relativní cestu k souboru použitému k zahájení trénování.
- script_params
- dict
Slovník argumentů příkazového řádku, které se mají předat vašemu trénovacímu skriptu zadanému v entry_script
.
- custom_docker_image
- str
Název image Dockeru, ze které se vytvoří image, která se má použít pro trénování. Pokud není nastavená, jako základní image se použije výchozí image založená na procesoru.
- user_managed
- bool
Určuje, jestli Azure ML opakovaně používá existující prostředí Pythonu. False znamená, že AzureML vytvoří prostředí Pythonu na základě specifikace závislostí conda.
- conda_packages
- list
Seznam řetězců představujících balíčky conda, které se mají přidat do prostředí Pythonu pro experiment.
- pip_packages
- list
Seznam řetězců představujících balíčky pip, které se mají přidat do prostředí Pythonu pro experiment.
- conda_dependencies_file_path
- str
Řetězec představující relativní cestu k souboru yaml závislostí conda.
Pokud je zadáno, Azure ML nenainstaluje žádné balíčky související s architekturou.
To je možné poskytnout v kombinaci s parametrem conda_packages
.
ZASTARALÉ. conda_dependencies_file
Použijte parametr .
- pip_requirements_file_path
- str
Řetězec představující relativní cestu k textovému souboru požadavků pip.
To je možné poskytnout v kombinaci s parametrem pip_packages
.
ZASTARALÉ. pip_requirements_file
Použijte parametr .
- conda_dependencies_file
- str
Řetězec představující relativní cestu k souboru yaml závislostí conda.
Pokud je zadáno, Azure ML nenainstaluje žádné balíčky související s architekturou.
To je možné poskytnout v kombinaci s parametrem conda_packages
.
- pip_requirements_file
- str
Řetězec představující relativní cestu k textovému souboru požadavků pip.
To je možné poskytnout v kombinaci s parametrem pip_packages
.
- environment_variables
- dict
Slovník názvů a hodnot proměnných prostředí. Tyto proměnné prostředí se nastavují v procesu, ve kterém se spouští uživatelský skript.
- environment_definition
- Environment
Definice prostředí pro experiment zahrnuje PythonSection, DockerSection a proměnné prostředí. Všechny možnosti prostředí, které nejsou přímo vystaveny prostřednictvím jiných parametrů pro konstrukci estimátoru, lze nastavit pomocí environment_definition
parametru. Pokud je tento parametr zadaný, bude mít přednost před jinými parametry souvisejícími s prostředím, jako use_gpu
jsou , custom_docker_image
, conda_packages
nebo pip_packages
.
Chyby budou hlášeny jako neplatné kombinace.
- inputs
- list
Seznam DataReference objektů nebo DatasetConsumptionConfig objektů, které se mají použít jako vstup.
- shm_size
- str
Velikost bloku sdílené paměti kontejneru Dockeru Pokud není nastavená, použije se výchozí azureml.core.environment._DEFAULT_SHM_SIZE.
- resume_from
- DataPath
Cesta k datům obsahující soubory kontrolního bodu nebo modelu, ze kterých se má experiment pokračovat.
- max_run_duration_seconds
- int
Maximální povolený čas pro spuštění. Azure ML se pokusí automaticky zrušit spuštění, pokud trvá déle, než je tato hodnota.
- framework_version
- str
Verze Scikit-learn, která se má použít ke spouštění trénovacího kódu.
SKLearn.get_supported_versions()
vrátí seznam verzí podporovaných aktuální sadou SDK.
- compute_target
- AbstractComputeTarget nebo str
Cílový výpočetní objekt, ve kterém bude probíhat trénování. Může to být buď objekt, nebo řetězec "local".
- vm_size
- str
Velikost virtuálního počítače cílového výpočetního objektu, který se vytvoří pro trénování. Podporované hodnoty: Libovolná velikost virtuálního počítače Azure.
- vm_priority
- str
Priorita virtuálního počítače cílového výpočetního objektu, který se vytvoří pro trénování. Pokud není zadáno, použije se "vyhrazené".
Podporované hodnoty: "dedicated" a "lowpriority".
To se projeví pouze v vm_size param
případě, že je ve vstupu zadána hodnota .
- entry_script
- str
Řetězec představující relativní cestu k souboru použitému k zahájení trénování.
- script_params
- dict
Slovník argumentů příkazového řádku, které se mají předat vašemu trénovacímu skriptu zadanému v entry_script
.
- use_docker
- bool
Logická hodnota označující, jestli by prostředí pro spuštění experimentu mělo být založené na Dockeru.
- custom_docker_image
- str
Název image Dockeru, ze které se vytvoří image, která se má použít pro trénování. Pokud není nastavená, jako základní image se použije výchozí image založená na procesoru.
- user_managed
- bool
Určuje, jestli Azure ML opakovaně používá existující prostředí Pythonu. False znamená, že AzureML vytvoří prostředí Pythonu na základě specifikace závislostí conda.
- conda_packages
- list
Seznam řetězců představujících balíčky conda, které se mají přidat do prostředí Pythonu pro experiment.
- pip_packages
- list
Seznam řetězců představujících balíčky pip, které se mají přidat do prostředí Pythonu pro experiment.
- conda_dependencies_file_path
- str
Řetězec představující relativní cestu k souboru yaml závislostí conda. Pokud je zadáno, Azure ML nenainstaluje žádné balíčky související s architekturou.
To je možné poskytnout v kombinaci s parametrem conda_packages
.
ZASTARALÉ. conda_dependencies_file
Použijte parametr .
- pip_requirements_file_path
- str
Řetězec představující relativní cestu k textovému souboru požadavků pip.
To je možné poskytnout v kombinaci s parametrem pip_packages
.
ZASTARALÉ. pip_requirements_file
Použijte parametr .
- conda_dependencies_file
- str
Řetězec představující relativní cestu k souboru yaml závislostí conda. Pokud je zadáno, Azure ML nenainstaluje žádné balíčky související s architekturou.
To je možné poskytnout v kombinaci s parametrem conda_packages
.
- pip_requirements_file
- str
Řetězec představující relativní cestu k textovému souboru požadavků pip.
To je možné poskytnout v kombinaci s parametrem pip_packages
.
- environment_variables
- dict
Slovník názvů a hodnot proměnných prostředí. Tyto proměnné prostředí se nastavují v procesu, ve kterém se spouští uživatelský skript.
- environment_definition
- Environment
Definice prostředí pro experiment zahrnuje PythonSection, DockerSection a proměnné prostředí. Všechny možnosti prostředí, které nejsou přímo vystaveny prostřednictvím jiných parametrů pro konstrukci estimátoru, lze nastavit pomocí environment_definition
parametru. Pokud je tento parametr zadaný, bude mít přednost před jinými parametry souvisejícími s prostředím, jako use_gpu
jsou , custom_docker_image
, conda_packages
nebo pip_packages
.
Chyby budou hlášeny jako neplatné kombinace.
- inputs
- list
Seznam azureml.data.data_reference. Objekty DataReference, které se použijí jako vstup.
- shm_size
- str
Velikost bloku sdílené paměti kontejneru Dockeru. Pokud není nastavená, použije se výchozí azureml.core.environment._DEFAULT_SHM_SIZE.
- resume_from
- DataPath
Cesta k datům obsahující kontrolní bod nebo soubory modelu, ze kterých chcete pokračovat v experimentu.
- max_run_duration_seconds
- int
Maximální povolený čas pro spuštění. Azure ML se pokusí automaticky zrušit spuštění, pokud trvá déle než tato hodnota.
- framework_version
- str
Verze Scikit-learn, která se použije ke spouštění trénovacího kódu.
SKLearn.get_supported_versions()
vrátí seznam verzí podporovaných aktuální sadou SDK.
- _enable_optimized_mode
- bool
Povolte přírůstkové sestavení prostředí s předem sestavenými imagemi architektury pro rychlejší přípravu prostředí. Předem sestavená image architektury je postavená na výchozích imagích procesoru/GPU Azure ML s předinstalovanými závislostmi architektury.
- _disable_validation
- bool
Před spuštěním odeslání zakažte ověřování skriptů. Výchozí hodnota je True.
- _show_lint_warnings
- bool
Zobrazit upozornění na lintování skriptů Výchozí hodnota je Nepravda.
- _show_package_warnings
- bool
Zobrazit upozornění ověření balíčku. Výchozí hodnota je Nepravda.
Poznámky
Při odesílání trénovací úlohy Azure ML spustí váš skript v prostředí conda v rámci kontejneru Dockeru. Kontejnery SKLearn mají nainstalované následující závislosti.
Závislosti | Scikit-learn 0.20.3 | ———————- | —————– | Python | 3.6.2 | azureml-defaults | Nejnovější | IntelMpi | 2018.3.222 | scikit-learn | 0.20.3 | numpy | 1.16.2 | miniconda | 4.5.11 | scipy | 1.2.1 | joblib | 0.13.2 | git | 2.7.4 |
Image Dockeru rozšiřují Ubuntu 16.04.
Pokud potřebujete nainstalovat další závislosti, můžete použít pip_packages
parametry nebo conda_packages
nebo zadat pip_requirements_file
soubor nebo conda_dependencies_file
. Alternativně můžete vytvořit vlastní image a předat custom_docker_image
parametr konstruktoru estimator.
Atributy
DEFAULT_VERSION
DEFAULT_VERSION = '0.20.3'
FRAMEWORK_NAME
FRAMEWORK_NAME = 'SKLearn'
Váš názor
https://aka.ms/ContentUserFeedback.
Připravujeme: V průběhu roku 2024 budeme postupně vyřazovat problémy z GitHub coby mechanismus zpětné vazby pro obsah a nahrazovat ho novým systémem zpětné vazby. Další informace naleznete v tématu:Odeslat a zobrazit názory pro