SKLearn Klasa
Tworzy narzędzie do szacowania na potrzeby trenowania w eksperymentach Scikit-learn.
PRZESTARZAŁE. ScriptRunConfig Użyj obiektu z własnym zdefiniowanym środowiskiem lub AzureML-Tutorial wyselekcjonowane środowisko. Aby zapoznać się z wprowadzeniem do konfigurowania przebiegów eksperymentów SKLearn za pomocą polecenia ScriptRunConfig, zobacz Szkolenie modeli scikit-learn na dużą skalę przy użyciu usługi Azure Machine Learning.
Ten narzędzie do szacowania obsługuje tylko trenowanie procesora CPU z jednym węzłem.
Obsługiwane wersje: 0.20.3
Zainicjuj narzędzie do szacowania Scikit-learn.
- Dziedziczenie
-
azureml.train.estimator._framework_base_estimator._FrameworkBaseEstimatorSKLearn
Konstruktor
SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)
Parametry
Nazwa | Opis |
---|---|
source_directory
Wymagane
|
Katalog lokalny zawierający pliki konfiguracji eksperymentu. |
compute_target
Wymagane
|
Docelowy obiekt obliczeniowy, w którym nastąpi trenowanie. Może to być obiekt lub ciąg "local". |
vm_size
Wymagane
|
Rozmiar maszyny wirtualnej docelowego obliczeniowego, który zostanie utworzony na potrzeby trenowania. Obsługiwane wartości: dowolny rozmiar maszyny wirtualnej platformy Azure. |
vm_priority
Wymagane
|
Priorytet maszyny wirtualnej docelowego obliczeniowego, który zostanie utworzony na potrzeby trenowania. Jeśli nie zostanie określona, zostanie użyta wartość "dedykowana". Obsługiwane wartości: "dedykowane" i "lowpriority". Ma to zastosowanie tylko wtedy, gdy |
entry_script
Wymagane
|
Ciąg reprezentujący ścieżkę względną do pliku użytego do rozpoczęcia trenowania. |
script_params
Wymagane
|
Słownik argumentów wiersza polecenia, który ma być przekazywany do skryptu szkoleniowego określonego w pliku |
custom_docker_image
Wymagane
|
Nazwa obrazu platformy Docker, z którego obraz do użycia do trenowania zostanie utworzony. Jeśli nie zostanie ustawiony, domyślny obraz oparty na procesorze zostanie użyty jako obraz podstawowy. |
image_registry_details
Wymagane
|
Szczegóły rejestru obrazów platformy Docker. |
user_managed
Wymagane
|
Określa, czy usługa Azure ML ponownie używa istniejącego środowiska języka Python. Fałsz oznacza, że usługa AzureML utworzy środowisko języka Python na podstawie specyfikacji zależności conda. |
conda_packages
Wymagane
|
Lista ciągów reprezentujących pakiety conda do dodania do środowiska języka Python na potrzeby eksperymentu. |
pip_packages
Wymagane
|
Lista ciągów reprezentujących pakiety pip do dodania do środowiska języka Python na potrzeby eksperymentu. |
conda_dependencies_file_path
Wymagane
|
Ciąg reprezentujący ścieżkę względną do pliku yaml zależności conda.
Jeśli zostanie określony, usługa Azure ML nie zainstaluje żadnych pakietów powiązanych ze strukturą.
Można to podać w połączeniu z parametrem |
pip_requirements_file_path
Wymagane
|
Ciąg reprezentujący ścieżkę względną do pliku tekstowego wymagań pip.
Można to podać w połączeniu z parametrem |
conda_dependencies_file
Wymagane
|
Ciąg reprezentujący ścieżkę względną do pliku yaml zależności conda.
Jeśli zostanie określony, usługa Azure ML nie zainstaluje żadnych pakietów powiązanych ze strukturą.
Można to podać w połączeniu z parametrem |
pip_requirements_file
Wymagane
|
Ciąg reprezentujący ścieżkę względną do pliku tekstowego wymagań pip.
Można to podać w połączeniu z parametrem |
environment_variables
Wymagane
|
Słownik nazw i wartości zmiennych środowiskowych. Te zmienne środowiskowe są ustawiane w procesie, w którym jest wykonywany skrypt użytkownika. |
environment_definition
Wymagane
|
Definicja środowiska eksperymentu obejmuje zmienne środowiskowe PythonSection, DockerSection i środowiskowe. Każda opcja środowiska nie jest bezpośrednio uwidaczniona za pośrednictwem innych parametrów do konstrukcji narzędzia do szacowania, można ustawić przy użyciu |
inputs
Wymagane
|
Lista obiektów lubDatasetConsumptionConfig, DataReference które mają być używane jako dane wejściowe. |
shm_size
Wymagane
|
Rozmiar bloku pamięci udostępnionej kontenera platformy Docker. Jeśli nie zostanie ustawiona, zostanie użyta domyślna azureml.core.environment._DEFAULT_SHM_SIZE. |
resume_from
Wymagane
|
Ścieżka danych zawierająca pliki punktu kontrolnego lub modelu, z których ma być wznowione eksperyment. |
max_run_duration_seconds
Wymagane
|
Maksymalny dozwolony czas przebiegu. Usługa Azure ML podejmie próbę automatycznego anulowania przebiegu, jeśli trwa dłużej niż ta wartość. |
framework_version
Wymagane
|
Wersja biblioteki Scikit-learn, która ma być używana do wykonywania kodu szkoleniowego.
|
source_directory
Wymagane
|
Katalog lokalny zawierający pliki konfiguracji eksperymentu. |
compute_target
Wymagane
|
Docelowy obiekt obliczeniowy, w którym nastąpi trenowanie. Może to być obiekt lub ciąg "local". |
vm_size
Wymagane
|
Rozmiar maszyny wirtualnej docelowego obliczeniowego, który zostanie utworzony na potrzeby trenowania. Obsługiwane wartości: dowolny rozmiar maszyny wirtualnej platformy Azure. |
vm_priority
Wymagane
|
Priorytet maszyny wirtualnej docelowego obliczeniowego, który zostanie utworzony na potrzeby trenowania. Jeśli nie zostanie określona, zostanie użyta wartość "dedykowana". Obsługiwane wartości: "dedykowane" i "lowpriority". Ma to zastosowanie tylko wtedy, gdy |
entry_script
Wymagane
|
Ciąg reprezentujący ścieżkę względną do pliku użytego do rozpoczęcia trenowania. |
script_params
Wymagane
|
Słownik argumentów wiersza polecenia, który ma być przekazywany do skryptu szkoleniowego określonego w pliku |
use_docker
Wymagane
|
Wartość logiczna wskazująca, czy środowisko do uruchomienia eksperymentu powinno być oparte na platformie Docker. |
custom_docker_image
Wymagane
|
Nazwa obrazu platformy Docker, z którego obraz do użycia do trenowania zostanie utworzony. Jeśli nie zostanie ustawiony, zostanie użyty domyślny obraz oparty na procesorze CPU jako obraz podstawowy. |
image_registry_details
Wymagane
|
Szczegóły rejestru obrazów platformy Docker. |
user_managed
Wymagane
|
Określa, czy usługa Azure ML ponownie używa istniejącego środowiska języka Python. Fałsz oznacza, że usługa AzureML utworzy środowisko języka Python na podstawie specyfikacji zależności conda. |
conda_packages
Wymagane
|
Lista ciągów reprezentujących pakiety conda do dodania do środowiska języka Python na potrzeby eksperymentu. |
pip_packages
Wymagane
|
Lista ciągów reprezentujących pakiety pip do dodania do środowiska języka Python na potrzeby eksperymentu. |
conda_dependencies_file_path
Wymagane
|
Ciąg reprezentujący ścieżkę względną do pliku yaml zależności conda. Jeśli zostanie określony, usługa Azure ML nie zainstaluje żadnych pakietów powiązanych ze strukturą.
Można to podać w połączeniu z parametrem |
pip_requirements_file_path
Wymagane
|
Ciąg reprezentujący ścieżkę względną do pliku tekstowego wymagań pip.
Można to podać w połączeniu z parametrem |
conda_dependencies_file
Wymagane
|
Ciąg reprezentujący ścieżkę względną do pliku yaml zależności conda. Jeśli zostanie określony, usługa Azure ML nie zainstaluje żadnych pakietów powiązanych ze strukturą.
Można to podać w połączeniu z parametrem |
pip_requirements_file
Wymagane
|
Ciąg reprezentujący ścieżkę względną do pliku tekstowego wymagań pip.
Można to podać w połączeniu z parametrem |
environment_variables
Wymagane
|
Słownik nazw i wartości zmiennych środowiskowych. Te zmienne środowiskowe są ustawiane w procesie, w którym jest wykonywany skrypt użytkownika. |
environment_definition
Wymagane
|
Definicja środowiska eksperymentu obejmuje zmienne środowiskowe PythonSection, DockerSection i środowiskowe. Każda opcja środowiska nie jest bezpośrednio uwidaczniona za pośrednictwem innych parametrów do konstrukcji narzędzia do szacowania, można ustawić przy użyciu |
inputs
Wymagane
|
Lista azureml.data.data_reference. Obiekty DataReference do użycia jako dane wejściowe. |
shm_size
Wymagane
|
Rozmiar bloku pamięci udostępnionej kontenera platformy Docker. Jeśli nie zostanie ustawiona, zostanie użyta domyślna azureml.core.environment._DEFAULT_SHM_SIZE. |
resume_from
Wymagane
|
Ścieżka danych zawierająca pliki punktu kontrolnego lub modelu, z których ma być wznowione eksperyment. |
max_run_duration_seconds
Wymagane
|
Maksymalny dozwolony czas przebiegu. Usługa Azure ML podejmie próbę automatycznego anulowania przebiegu, jeśli trwa dłużej niż ta wartość. |
framework_version
Wymagane
|
Wersja biblioteki Scikit-learn, która ma być używana do wykonywania kodu szkoleniowego.
|
_enable_optimized_mode
Wymagane
|
Włącz kompilację środowiska przyrostowego przy użyciu wstępnie utworzonych obrazów platform w celu szybszego przygotowania środowiska. Wstępnie utworzony obraz platformy jest oparty na domyślnych obrazach podstawowych procesora CPU/procesora GPU usługi Azure ML ze wstępnie zainstalowanymi zależnościami platformy. |
_disable_validation
Wymagane
|
Wyłącz walidację skryptu przed przesłaniem. Wartość domyślna to True. |
_show_lint_warnings
Wymagane
|
Pokaż ostrzeżenia dotyczące lintingu skryptu. Wartość domyślna to False. |
_show_package_warnings
Wymagane
|
Pokaż ostrzeżenia dotyczące walidacji pakietu. Wartość domyślna to False. |
Uwagi
Podczas przesyłania zadania szkoleniowego usługa Azure ML uruchamia skrypt w środowisku conda w kontenerze platformy Docker. Kontenery SKLearn mają zainstalowane następujące zależności.
Zależności | Scikit-learn 0.20.3 | ———————- | —————– | Python | 3.6.2 | azureml-defaults | Najnowsze | IntelMpi | 2018.3.222 | scikit-learn | 0.20.3 | numpy | 1.16.2 | miniconda | 4.5.11 | scipy | 1.2.1 | joblib | 0.13.2 | git | 2.7.4 |
Obrazy platformy Docker rozszerzają system Ubuntu 16.04.
Jeśli musisz zainstalować dodatkowe zależności, możesz użyć parametrów pip_packages
lub conda_packages
albo podać plik pip_requirements_file
lub conda_dependencies_file
. Alternatywnie możesz utworzyć własny obraz i przekazać custom_docker_image
parametr do konstruktora narzędzia do szacowania.
Atrybuty
DEFAULT_VERSION
DEFAULT_VERSION = '0.20.3'
FRAMEWORK_NAME
FRAMEWORK_NAME = 'SKLearn'