SKLearn Klasa
Tworzy narzędzie do szacowania na potrzeby trenowania w eksperymentach Scikit-learn.
PRZESTARZAŁE. ScriptRunConfig Użyj obiektu z własnym zdefiniowanym środowiskiem lub AzureML-Tutorial wyselekcjonowane środowisko. Aby zapoznać się z wprowadzeniem do konfigurowania przebiegów eksperymentów SKLearn za pomocą polecenia ScriptRunConfig, zobacz Szkolenie modeli scikit-learn na dużą skalę przy użyciu usługi Azure Machine Learning.
Ten narzędzie do szacowania obsługuje tylko trenowanie procesora CPU z jednym węzłem.
Obsługiwane wersje: 0.20.3
Zainicjuj narzędzie do szacowania Scikit-learn.
- Dziedziczenie
-
azureml.train.estimator._framework_base_estimator._FrameworkBaseEstimatorSKLearn
Konstruktor
SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)
Parametry
- compute_target
- AbstractComputeTarget lub str
Docelowy obiekt obliczeniowy, w którym nastąpi trenowanie. Może to być obiekt lub ciąg "local".
- vm_size
- str
Rozmiar maszyny wirtualnej docelowego obliczeniowego, który zostanie utworzony na potrzeby trenowania.
Obsługiwane wartości: dowolny rozmiar maszyny wirtualnej platformy Azure.
- vm_priority
- str
Priorytet maszyny wirtualnej docelowego obliczeniowego, który zostanie utworzony na potrzeby trenowania. Jeśli nie zostanie określona, zostanie użyta wartość "dedykowana".
Obsługiwane wartości: "dedykowane" i "lowpriority".
Ma to zastosowanie tylko wtedy, gdy vm_size param
element jest określony w danych wejściowych.
- entry_script
- str
Ciąg reprezentujący ścieżkę względną do pliku użytego do rozpoczęcia trenowania.
- script_params
- dict
Słownik argumentów wiersza polecenia, który ma być przekazywany do skryptu szkoleniowego określonego w pliku entry_script
.
- custom_docker_image
- str
Nazwa obrazu platformy Docker, z którego obraz do użycia do trenowania zostanie utworzony. Jeśli nie zostanie ustawiony, domyślny obraz oparty na procesorze zostanie użyty jako obraz podstawowy.
- user_managed
- bool
Określa, czy usługa Azure ML ponownie używa istniejącego środowiska języka Python. Fałsz oznacza, że usługa AzureML utworzy środowisko języka Python na podstawie specyfikacji zależności conda.
- conda_packages
- list
Lista ciągów reprezentujących pakiety conda do dodania do środowiska języka Python na potrzeby eksperymentu.
- pip_packages
- list
Lista ciągów reprezentujących pakiety pip do dodania do środowiska języka Python na potrzeby eksperymentu.
- conda_dependencies_file_path
- str
Ciąg reprezentujący ścieżkę względną do pliku yaml zależności conda.
Jeśli zostanie określony, usługa Azure ML nie zainstaluje żadnych pakietów powiązanych ze strukturą.
Można to podać w połączeniu z parametrem conda_packages
.
PRZESTARZAŁE. Użyj parametru conda_dependencies_file
.
- pip_requirements_file_path
- str
Ciąg reprezentujący ścieżkę względną do pliku tekstowego wymagań pip.
Można to podać w połączeniu z parametrem pip_packages
.
PRZESTARZAŁE. Użyj parametru pip_requirements_file
.
- conda_dependencies_file
- str
Ciąg reprezentujący ścieżkę względną do pliku yaml zależności conda.
Jeśli zostanie określony, usługa Azure ML nie zainstaluje żadnych pakietów powiązanych ze strukturą.
Można to podać w połączeniu z parametrem conda_packages
.
- pip_requirements_file
- str
Ciąg reprezentujący ścieżkę względną do pliku tekstowego wymagań pip.
Można to podać w połączeniu z parametrem pip_packages
.
- environment_variables
- dict
Słownik nazw i wartości zmiennych środowiskowych. Te zmienne środowiskowe są ustawiane w procesie, w którym jest wykonywany skrypt użytkownika.
- environment_definition
- Environment
Definicja środowiska eksperymentu obejmuje zmienne środowiskowe PythonSection, DockerSection i środowiskowe. Każda opcja środowiska nie jest bezpośrednio uwidaczniona za pośrednictwem innych parametrów do konstrukcji narzędzia do szacowania, można ustawić przy użyciu environment_definition
parametru . Jeśli ten parametr zostanie określony, pierwszeństwo przed innymi parametrami powiązanymi ze środowiskiem, takimi jak use_gpu
, , custom_docker_image
lub conda_packages
pip_packages
.
Błędy będą zgłaszane nieprawidłowe kombinacje.
- inputs
- list
Lista obiektów lubDatasetConsumptionConfig, DataReference które mają być używane jako dane wejściowe.
- shm_size
- str
Rozmiar bloku pamięci udostępnionej kontenera platformy Docker. Jeśli nie zostanie ustawiona, zostanie użyta domyślna azureml.core.environment._DEFAULT_SHM_SIZE.
- resume_from
- DataPath
Ścieżka danych zawierająca pliki punktu kontrolnego lub modelu, z których ma być wznowione eksperyment.
- max_run_duration_seconds
- int
Maksymalny dozwolony czas przebiegu. Usługa Azure ML podejmie próbę automatycznego anulowania przebiegu, jeśli trwa dłużej niż ta wartość.
- framework_version
- str
Wersja biblioteki Scikit-learn, która ma być używana do wykonywania kodu szkoleniowego.
SKLearn.get_supported_versions()
Zwraca listę wersji obsługiwanych przez bieżący zestaw SDK.
- compute_target
- AbstractComputeTarget lub str
Docelowy obiekt obliczeniowy, w którym nastąpi trenowanie. Może to być obiekt lub ciąg "local".
- vm_size
- str
Rozmiar maszyny wirtualnej docelowego obliczeniowego, który zostanie utworzony na potrzeby trenowania. Obsługiwane wartości: dowolny rozmiar maszyny wirtualnej platformy Azure.
- vm_priority
- str
Priorytet maszyny wirtualnej docelowego obliczeniowego, który zostanie utworzony na potrzeby trenowania. Jeśli nie zostanie określona, zostanie użyta wartość "dedykowana".
Obsługiwane wartości: "dedykowane" i "lowpriority".
Ma to zastosowanie tylko wtedy, gdy vm_size param
element jest określony w danych wejściowych.
- entry_script
- str
Ciąg reprezentujący ścieżkę względną do pliku użytego do rozpoczęcia trenowania.
- script_params
- dict
Słownik argumentów wiersza polecenia, który ma być przekazywany do skryptu szkoleniowego określonego w pliku entry_script
.
- use_docker
- bool
Wartość logiczna wskazująca, czy środowisko do uruchomienia eksperymentu powinno być oparte na platformie Docker.
- custom_docker_image
- str
Nazwa obrazu platformy Docker, z którego obraz do użycia do trenowania zostanie utworzony. Jeśli nie zostanie ustawiony, zostanie użyty domyślny obraz oparty na procesorze CPU jako obraz podstawowy.
- user_managed
- bool
Określa, czy usługa Azure ML ponownie używa istniejącego środowiska języka Python. Fałsz oznacza, że usługa AzureML utworzy środowisko języka Python na podstawie specyfikacji zależności conda.
- conda_packages
- list
Lista ciągów reprezentujących pakiety conda do dodania do środowiska języka Python na potrzeby eksperymentu.
- pip_packages
- list
Lista ciągów reprezentujących pakiety pip do dodania do środowiska języka Python na potrzeby eksperymentu.
- conda_dependencies_file_path
- str
Ciąg reprezentujący ścieżkę względną do pliku yaml zależności conda. Jeśli zostanie określony, usługa Azure ML nie zainstaluje żadnych pakietów powiązanych ze strukturą.
Można to podać w połączeniu z parametrem conda_packages
.
PRZESTARZAŁE. Użyj parametru conda_dependencies_file
.
- pip_requirements_file_path
- str
Ciąg reprezentujący ścieżkę względną do pliku tekstowego wymagań pip.
Można to podać w połączeniu z parametrem pip_packages
.
PRZESTARZAŁE. Użyj parametru pip_requirements_file
.
- conda_dependencies_file
- str
Ciąg reprezentujący ścieżkę względną do pliku yaml zależności conda. Jeśli zostanie określony, usługa Azure ML nie zainstaluje żadnych pakietów powiązanych ze strukturą.
Można to podać w połączeniu z parametrem conda_packages
.
- pip_requirements_file
- str
Ciąg reprezentujący ścieżkę względną do pliku tekstowego wymagań pip.
Można to podać w połączeniu z parametrem pip_packages
.
- environment_variables
- dict
Słownik nazw i wartości zmiennych środowiskowych. Te zmienne środowiskowe są ustawiane w procesie, w którym jest wykonywany skrypt użytkownika.
- environment_definition
- Environment
Definicja środowiska eksperymentu obejmuje zmienne środowiskowe PythonSection, DockerSection i środowiskowe. Każda opcja środowiska nie jest bezpośrednio uwidaczniona za pośrednictwem innych parametrów do konstrukcji narzędzia do szacowania, można ustawić przy użyciu environment_definition
parametru . Jeśli ten parametr zostanie określony, pierwszeństwo przed innymi parametrami powiązanymi ze środowiskiem, takimi jak use_gpu
, , custom_docker_image
lub conda_packages
pip_packages
.
Błędy będą zgłaszane nieprawidłowe kombinacje.
- inputs
- list
Lista azureml.data.data_reference. Obiekty DataReference do użycia jako dane wejściowe.
- shm_size
- str
Rozmiar bloku pamięci udostępnionej kontenera platformy Docker. Jeśli nie zostanie ustawiona, zostanie użyta domyślna azureml.core.environment._DEFAULT_SHM_SIZE.
- resume_from
- DataPath
Ścieżka danych zawierająca pliki punktu kontrolnego lub modelu, z których ma być wznowione eksperyment.
- max_run_duration_seconds
- int
Maksymalny dozwolony czas przebiegu. Usługa Azure ML podejmie próbę automatycznego anulowania przebiegu, jeśli trwa dłużej niż ta wartość.
- framework_version
- str
Wersja biblioteki Scikit-learn, która ma być używana do wykonywania kodu szkoleniowego.
SKLearn.get_supported_versions()
Zwraca listę wersji obsługiwanych przez bieżący zestaw SDK.
- _enable_optimized_mode
- bool
Włącz kompilację środowiska przyrostowego przy użyciu wstępnie utworzonych obrazów platform w celu szybszego przygotowania środowiska. Wstępnie utworzony obraz platformy jest oparty na domyślnych obrazach podstawowych procesora CPU/procesora GPU usługi Azure ML ze wstępnie zainstalowanymi zależnościami platformy.
- _disable_validation
- bool
Wyłącz walidację skryptu przed przesłaniem. Wartość domyślna to True.
- _show_lint_warnings
- bool
Pokaż ostrzeżenia dotyczące lintingu skryptu. Wartość domyślna to False.
- _show_package_warnings
- bool
Pokaż ostrzeżenia dotyczące walidacji pakietu. Wartość domyślna to False.
Uwagi
Podczas przesyłania zadania szkoleniowego usługa Azure ML uruchamia skrypt w środowisku conda w kontenerze platformy Docker. Kontenery SKLearn mają zainstalowane następujące zależności.
Zależności | Scikit-learn 0.20.3 | ———————- | —————– | Python | 3.6.2 | azureml-defaults | Najnowsze | IntelMpi | 2018.3.222 | scikit-learn | 0.20.3 | numpy | 1.16.2 | miniconda | 4.5.11 | scipy | 1.2.1 | joblib | 0.13.2 | git | 2.7.4 |
Obrazy platformy Docker rozszerzają system Ubuntu 16.04.
Jeśli musisz zainstalować dodatkowe zależności, możesz użyć parametrów pip_packages
lub conda_packages
albo podać plik pip_requirements_file
lub conda_dependencies_file
. Alternatywnie możesz utworzyć własny obraz i przekazać custom_docker_image
parametr do konstruktora narzędzia do szacowania.
Atrybuty
DEFAULT_VERSION
DEFAULT_VERSION = '0.20.3'
FRAMEWORK_NAME
FRAMEWORK_NAME = 'SKLearn'
Opinia
https://aka.ms/ContentUserFeedback.
Dostępne już wkrótce: W 2024 r. będziemy stopniowo wycofywać zgłoszenia z serwisu GitHub jako mechanizm przesyłania opinii na temat zawartości i zastępować go nowym systemem opinii. Aby uzyskać więcej informacji, sprawdź:Prześlij i wyświetl opinię dla