Udostępnij za pośrednictwem


SKLearn Klasa

Tworzy narzędzie do szacowania na potrzeby trenowania w eksperymentach Scikit-learn.

PRZESTARZAŁE. ScriptRunConfig Użyj obiektu z własnym zdefiniowanym środowiskiem lub AzureML-Tutorial wyselekcjonowane środowisko. Aby zapoznać się z wprowadzeniem do konfigurowania przebiegów eksperymentów SKLearn za pomocą polecenia ScriptRunConfig, zobacz Szkolenie modeli scikit-learn na dużą skalę przy użyciu usługi Azure Machine Learning.

Ten narzędzie do szacowania obsługuje tylko trenowanie procesora CPU z jednym węzłem.

Obsługiwane wersje: 0.20.3

Zainicjuj narzędzie do szacowania Scikit-learn.

Dziedziczenie
azureml.train.estimator._framework_base_estimator._FrameworkBaseEstimator
SKLearn

Konstruktor

SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)

Parametry

source_directory
str
Wymagane

Katalog lokalny zawierający pliki konfiguracji eksperymentu.

compute_target
AbstractComputeTarget lub str
Wymagane

Docelowy obiekt obliczeniowy, w którym nastąpi trenowanie. Może to być obiekt lub ciąg "local".

vm_size
str
Wymagane

Rozmiar maszyny wirtualnej docelowego obliczeniowego, który zostanie utworzony na potrzeby trenowania.

Obsługiwane wartości: dowolny rozmiar maszyny wirtualnej platformy Azure.

vm_priority
str
Wymagane

Priorytet maszyny wirtualnej docelowego obliczeniowego, który zostanie utworzony na potrzeby trenowania. Jeśli nie zostanie określona, zostanie użyta wartość "dedykowana".

Obsługiwane wartości: "dedykowane" i "lowpriority".

Ma to zastosowanie tylko wtedy, gdy vm_size param element jest określony w danych wejściowych.

entry_script
str
Wymagane

Ciąg reprezentujący ścieżkę względną do pliku użytego do rozpoczęcia trenowania.

script_params
dict
Wymagane

Słownik argumentów wiersza polecenia, który ma być przekazywany do skryptu szkoleniowego określonego w pliku entry_script.

custom_docker_image
str
Wymagane

Nazwa obrazu platformy Docker, z którego obraz do użycia do trenowania zostanie utworzony. Jeśli nie zostanie ustawiony, domyślny obraz oparty na procesorze zostanie użyty jako obraz podstawowy.

image_registry_details
ContainerRegistry
Wymagane

Szczegóły rejestru obrazów platformy Docker.

user_managed
bool
Wymagane

Określa, czy usługa Azure ML ponownie używa istniejącego środowiska języka Python. Fałsz oznacza, że usługa AzureML utworzy środowisko języka Python na podstawie specyfikacji zależności conda.

conda_packages
list
Wymagane

Lista ciągów reprezentujących pakiety conda do dodania do środowiska języka Python na potrzeby eksperymentu.

pip_packages
list
Wymagane

Lista ciągów reprezentujących pakiety pip do dodania do środowiska języka Python na potrzeby eksperymentu.

conda_dependencies_file_path
str
Wymagane

Ciąg reprezentujący ścieżkę względną do pliku yaml zależności conda. Jeśli zostanie określony, usługa Azure ML nie zainstaluje żadnych pakietów powiązanych ze strukturą. Można to podać w połączeniu z parametrem conda_packages . PRZESTARZAŁE. Użyj parametru conda_dependencies_file .

pip_requirements_file_path
str
Wymagane

Ciąg reprezentujący ścieżkę względną do pliku tekstowego wymagań pip. Można to podać w połączeniu z parametrem pip_packages . PRZESTARZAŁE. Użyj parametru pip_requirements_file .

conda_dependencies_file
str
Wymagane

Ciąg reprezentujący ścieżkę względną do pliku yaml zależności conda. Jeśli zostanie określony, usługa Azure ML nie zainstaluje żadnych pakietów powiązanych ze strukturą. Można to podać w połączeniu z parametrem conda_packages .

pip_requirements_file
str
Wymagane

Ciąg reprezentujący ścieżkę względną do pliku tekstowego wymagań pip. Można to podać w połączeniu z parametrem pip_packages .

environment_variables
dict
Wymagane

Słownik nazw i wartości zmiennych środowiskowych. Te zmienne środowiskowe są ustawiane w procesie, w którym jest wykonywany skrypt użytkownika.

environment_definition
Environment
Wymagane

Definicja środowiska eksperymentu obejmuje zmienne środowiskowe PythonSection, DockerSection i środowiskowe. Każda opcja środowiska nie jest bezpośrednio uwidaczniona za pośrednictwem innych parametrów do konstrukcji narzędzia do szacowania, można ustawić przy użyciu environment_definition parametru . Jeśli ten parametr zostanie określony, pierwszeństwo przed innymi parametrami powiązanymi ze środowiskiem, takimi jak use_gpu, , custom_docker_imagelub conda_packagespip_packages. Błędy będą zgłaszane nieprawidłowe kombinacje.

inputs
list
Wymagane

Lista obiektów lubDatasetConsumptionConfig, DataReference które mają być używane jako dane wejściowe.

shm_size
str
Wymagane

Rozmiar bloku pamięci udostępnionej kontenera platformy Docker. Jeśli nie zostanie ustawiona, zostanie użyta domyślna azureml.core.environment._DEFAULT_SHM_SIZE.

resume_from
DataPath
Wymagane

Ścieżka danych zawierająca pliki punktu kontrolnego lub modelu, z których ma być wznowione eksperyment.

max_run_duration_seconds
int
Wymagane

Maksymalny dozwolony czas przebiegu. Usługa Azure ML podejmie próbę automatycznego anulowania przebiegu, jeśli trwa dłużej niż ta wartość.

framework_version
str
Wymagane

Wersja biblioteki Scikit-learn, która ma być używana do wykonywania kodu szkoleniowego. SKLearn.get_supported_versions() Zwraca listę wersji obsługiwanych przez bieżący zestaw SDK.

source_directory
str
Wymagane

Katalog lokalny zawierający pliki konfiguracji eksperymentu.

compute_target
AbstractComputeTarget lub str
Wymagane

Docelowy obiekt obliczeniowy, w którym nastąpi trenowanie. Może to być obiekt lub ciąg "local".

vm_size
str
Wymagane

Rozmiar maszyny wirtualnej docelowego obliczeniowego, który zostanie utworzony na potrzeby trenowania. Obsługiwane wartości: dowolny rozmiar maszyny wirtualnej platformy Azure.

vm_priority
str
Wymagane

Priorytet maszyny wirtualnej docelowego obliczeniowego, który zostanie utworzony na potrzeby trenowania. Jeśli nie zostanie określona, zostanie użyta wartość "dedykowana".

Obsługiwane wartości: "dedykowane" i "lowpriority".

Ma to zastosowanie tylko wtedy, gdy vm_size param element jest określony w danych wejściowych.

entry_script
str
Wymagane

Ciąg reprezentujący ścieżkę względną do pliku użytego do rozpoczęcia trenowania.

script_params
dict
Wymagane

Słownik argumentów wiersza polecenia, który ma być przekazywany do skryptu szkoleniowego określonego w pliku entry_script.

use_docker
bool
Wymagane

Wartość logiczna wskazująca, czy środowisko do uruchomienia eksperymentu powinno być oparte na platformie Docker.

custom_docker_image
str
Wymagane

Nazwa obrazu platformy Docker, z którego obraz do użycia do trenowania zostanie utworzony. Jeśli nie zostanie ustawiony, zostanie użyty domyślny obraz oparty na procesorze CPU jako obraz podstawowy.

image_registry_details
ContainerRegistry
Wymagane

Szczegóły rejestru obrazów platformy Docker.

user_managed
bool
Wymagane

Określa, czy usługa Azure ML ponownie używa istniejącego środowiska języka Python. Fałsz oznacza, że usługa AzureML utworzy środowisko języka Python na podstawie specyfikacji zależności conda.

conda_packages
list
Wymagane

Lista ciągów reprezentujących pakiety conda do dodania do środowiska języka Python na potrzeby eksperymentu.

pip_packages
list
Wymagane

Lista ciągów reprezentujących pakiety pip do dodania do środowiska języka Python na potrzeby eksperymentu.

conda_dependencies_file_path
str
Wymagane

Ciąg reprezentujący ścieżkę względną do pliku yaml zależności conda. Jeśli zostanie określony, usługa Azure ML nie zainstaluje żadnych pakietów powiązanych ze strukturą. Można to podać w połączeniu z parametrem conda_packages . PRZESTARZAŁE. Użyj parametru conda_dependencies_file .

pip_requirements_file_path
str
Wymagane

Ciąg reprezentujący ścieżkę względną do pliku tekstowego wymagań pip. Można to podać w połączeniu z parametrem pip_packages . PRZESTARZAŁE. Użyj parametru pip_requirements_file .

conda_dependencies_file
str
Wymagane

Ciąg reprezentujący ścieżkę względną do pliku yaml zależności conda. Jeśli zostanie określony, usługa Azure ML nie zainstaluje żadnych pakietów powiązanych ze strukturą. Można to podać w połączeniu z parametrem conda_packages .

pip_requirements_file
str
Wymagane

Ciąg reprezentujący ścieżkę względną do pliku tekstowego wymagań pip. Można to podać w połączeniu z parametrem pip_packages .

environment_variables
dict
Wymagane

Słownik nazw i wartości zmiennych środowiskowych. Te zmienne środowiskowe są ustawiane w procesie, w którym jest wykonywany skrypt użytkownika.

environment_definition
Environment
Wymagane

Definicja środowiska eksperymentu obejmuje zmienne środowiskowe PythonSection, DockerSection i środowiskowe. Każda opcja środowiska nie jest bezpośrednio uwidaczniona za pośrednictwem innych parametrów do konstrukcji narzędzia do szacowania, można ustawić przy użyciu environment_definition parametru . Jeśli ten parametr zostanie określony, pierwszeństwo przed innymi parametrami powiązanymi ze środowiskiem, takimi jak use_gpu, , custom_docker_imagelub conda_packagespip_packages. Błędy będą zgłaszane nieprawidłowe kombinacje.

inputs
list
Wymagane

Lista azureml.data.data_reference. Obiekty DataReference do użycia jako dane wejściowe.

shm_size
str
Wymagane

Rozmiar bloku pamięci udostępnionej kontenera platformy Docker. Jeśli nie zostanie ustawiona, zostanie użyta domyślna azureml.core.environment._DEFAULT_SHM_SIZE.

resume_from
DataPath
Wymagane

Ścieżka danych zawierająca pliki punktu kontrolnego lub modelu, z których ma być wznowione eksperyment.

max_run_duration_seconds
int
Wymagane

Maksymalny dozwolony czas przebiegu. Usługa Azure ML podejmie próbę automatycznego anulowania przebiegu, jeśli trwa dłużej niż ta wartość.

framework_version
str
Wymagane

Wersja biblioteki Scikit-learn, która ma być używana do wykonywania kodu szkoleniowego. SKLearn.get_supported_versions() Zwraca listę wersji obsługiwanych przez bieżący zestaw SDK.

_enable_optimized_mode
bool
Wymagane

Włącz kompilację środowiska przyrostowego przy użyciu wstępnie utworzonych obrazów platform w celu szybszego przygotowania środowiska. Wstępnie utworzony obraz platformy jest oparty na domyślnych obrazach podstawowych procesora CPU/procesora GPU usługi Azure ML ze wstępnie zainstalowanymi zależnościami platformy.

_disable_validation
bool
Wymagane

Wyłącz walidację skryptu przed przesłaniem. Wartość domyślna to True.

_show_lint_warnings
bool
Wymagane

Pokaż ostrzeżenia dotyczące lintingu skryptu. Wartość domyślna to False.

_show_package_warnings
bool
Wymagane

Pokaż ostrzeżenia dotyczące walidacji pakietu. Wartość domyślna to False.

Uwagi

Podczas przesyłania zadania szkoleniowego usługa Azure ML uruchamia skrypt w środowisku conda w kontenerze platformy Docker. Kontenery SKLearn mają zainstalowane następujące zależności.

Zależności | Scikit-learn 0.20.3 | ———————- | —————– | Python | 3.6.2 | azureml-defaults | Najnowsze | IntelMpi | 2018.3.222 | scikit-learn | 0.20.3 | numpy | 1.16.2 | miniconda | 4.5.11 | scipy | 1.2.1 | joblib | 0.13.2 | git | 2.7.4 |

Obrazy platformy Docker rozszerzają system Ubuntu 16.04.

Jeśli musisz zainstalować dodatkowe zależności, możesz użyć parametrów pip_packages lub conda_packages albo podać plik pip_requirements_file lub conda_dependencies_file . Alternatywnie możesz utworzyć własny obraz i przekazać custom_docker_image parametr do konstruktora narzędzia do szacowania.

Atrybuty

DEFAULT_VERSION

DEFAULT_VERSION = '0.20.3'

FRAMEWORK_NAME

FRAMEWORK_NAME = 'SKLearn'