SKLearn Klasse

Erstellt einen Schätzer für das Training in Scikit-learn-Experimenten.

VERALTET. Verwenden Sie das ScriptRunConfig-Objekt mit Ihrer eigenen definierten Umgebung oder die zusammengestellte Umgebung AzureML-Tutorial. Eine Einführung in die Konfiguration von SKLearn-Experimentausführungen mit ScriptRunConfig finden Sie unter Trainieren von Scikit-learn-Modellen im großen Stil mit Azure Machine Learning.

Dieser Schätzer unterstützt nur das CPU-Training mit einem Knoten.

Unterstützte Versionen: 0.20.3

Initialisieren Sie einen Scikit-learn-Schätzer.

Vererbung
azureml.train.estimator._framework_base_estimator._FrameworkBaseEstimator
SKLearn

Konstruktor

SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)

Parameter

source_directory
str
Erforderlich

Ein lokales Verzeichnis mit Konfigurationsdateien für Experimente.

compute_target
AbstractComputeTarget oder str
Erforderlich

Das Computeziel für das Training. Dies kann entweder ein Objekt oder die Zeichenfolge „local“ sein.

vm_size
str
Erforderlich

Die VM-Größe des Computeziels, das für das Training erstellt wird.

Unterstützte Werte: beliebige Azure-VM-Größen.

vm_priority
str
Erforderlich

Die VM-Priorität des Computeziels, das für das Training erstellt wird. Wenn keine Angabe erfolgt, wird „dedicated“ verwendet.

Unterstützte Werte: „dedicated“ und „lowpriority“.

Wird nur angewandt, wenn vm_size param in der Eingabe angegeben wird.

entry_script
str
Erforderlich

Eine Zeichenfolge, die den relativen Pfad zu der Datei repräsentiert, die zum Starten des Trainings verwendet wird.

script_params
dict
Erforderlich

Ein Wörterbuch mit Befehlszeilenargumenten, die an das in entry_script angegebene Trainingsskript übergeben werden.

custom_docker_image
str
Erforderlich

Der Name des Docker-Images, mit dem das für das Training zu verwendende Image erstellt wird. Wenn diese Einstellung nicht festgelegt ist, wird als Basisimage ein CPU-basiertes Standardimage verwendet.

image_registry_details
ContainerRegistry
Erforderlich

Die Details der Docker-Imageregistrierung

user_managed
bool
Erforderlich

Gibt an, ob Azure Machine Learning eine vorhandene Python-Umgebung wiederverwendet Bei einer Festlegung auf FALSE erstellt Azure Machine Learning eine Python-Umgebung basierend auf der Spezifikation der Conda-Abhängigkeiten.

conda_packages
list
Erforderlich

Eine Liste von Zeichenfolgen, die Conda-Pakete darstellen, die der Python-Umgebung für das Experiment hinzugefügt werden sollen

pip_packages
list
Erforderlich

Eine Liste von Zeichenfolgen, die pip-Pakete darstellen, die der Python-Umgebung für das Experiment hinzugefügt werden sollen

conda_dependencies_file_path
str
Erforderlich

Eine Zeichenfolge, die den relativen Pfad zur YAML-Datei der Conda-Abhängigkeiten darstellt. Falls angegeben, installiert Azure Machine Learning keine frameworkbezogenen Pakete. Dieser kann in Kombination mit dem Parameter conda_packages bereitgestellt werden. VERALTET. Verwenden Sie den Parameter conda_dependencies_file.

pip_requirements_file_path
str
Erforderlich

Eine Zeichenfolge, die den relativen Pfad zur Pip-Anforderungstextdatei darstellt. Dieser kann in Kombination mit dem Parameter pip_packages bereitgestellt werden. VERALTET. Verwenden Sie den Parameter pip_requirements_file.

conda_dependencies_file
str
Erforderlich

Eine Zeichenfolge, die den relativen Pfad zur YAML-Datei der Conda-Abhängigkeiten darstellt. Falls angegeben, installiert Azure Machine Learning keine frameworkbezogenen Pakete. Dieser kann in Kombination mit dem Parameter conda_packages bereitgestellt werden.

pip_requirements_file
str
Erforderlich

Eine Zeichenfolge, die den relativen Pfad zur Pip-Anforderungstextdatei darstellt. Dieser kann in Kombination mit dem Parameter pip_packages bereitgestellt werden.

environment_variables
dict
Erforderlich

Ein Wörterbuch mit Umgebungsvariablennamen und Werten. Diese Umgebungsvariablen werden für den Prozess festgelegt, in dem das Benutzerskript ausgeführt wird.

environment_definition
Environment
Erforderlich

Die Umgebungsdefinition für ein Experiment umfasst „PythonSection“, „DockerSection“ und Umgebungsvariablen. Jede Umgebungsoption, die nicht direkt über andere Parameter für die Erstellung des Schätzers verfügbar gemacht wird, kann mit dem Parameter environment_definition festgelegt werden. Wenn dieser Parameter angegeben wird, hat er Vorrang vor anderen umgebungsbezogenen Parametern wie use_gpu, custom_docker_image, conda_packages oder pip_packages. Bei ungültigen Kombinationen werden Fehler gemeldet.

inputs
list
Erforderlich

Eine Liste von DataReference- oder DatasetConsumptionConfig-Objekten, die als Eingabe verwendet werden sollen

shm_size
str
Erforderlich

Größe des freigegebenen Speicherblocks des Docker-Containers. Wenn diese Einstellung nicht festgelegt ist, wird die Standardgröße „azureml.core.environment._DEFAULT_SHM_SIZE“ verwendet.

resume_from
DataPath
Erforderlich

Der Datenpfad, der die Prüfpunkt- oder Modelldateien enthält, aus denen das Experiment fortgesetzt werden soll

max_run_duration_seconds
int
Erforderlich

Die maximal zulässige Zeit für die Ausführung Azure Machine Learning versucht, die Ausführung automatisch abzubrechen, wenn sie länger dauert als dieser Wert angibt.

framework_version
str
Erforderlich

Die Scikit-learn-Version, die zum Ausführen von Trainingscode verwendet werden soll. SKLearn.get_supported_versions() gibt eine Liste der vom aktuellen SDK unterstützten Versionen zurück.

source_directory
str
Erforderlich

Ein lokales Verzeichnis mit Konfigurationsdateien für Experimente.

compute_target
AbstractComputeTarget oder str
Erforderlich

Das Computeziel für das Training. Dies kann entweder ein Objekt oder die Zeichenfolge „local“ sein.

vm_size
str
Erforderlich

Die VM-Größe des Computeziels, das für das Training erstellt wird. Unterstützte Werte: beliebige Azure-VM-Größen.

vm_priority
str
Erforderlich

Die VM-Priorität des Computeziels, das für das Training erstellt wird. Wenn keine Angabe erfolgt, wird „dedicated“ verwendet.

Unterstützte Werte: „dedicated“ und „lowpriority“.

Wird nur angewandt, wenn vm_size param in der Eingabe angegeben wird.

entry_script
str
Erforderlich

Eine Zeichenfolge, die den relativen Pfad zu der Datei repräsentiert, die zum Starten des Trainings verwendet wird.

script_params
dict
Erforderlich

Ein Wörterbuch mit Befehlszeilenargumenten, die an das in entry_script angegebene Trainingsskript übergeben werden.

use_docker
bool
Erforderlich

Ein Bool-Wert, der angibt, ob die Umgebung, in der das Experiment ausgeführt werden soll, Docker-basiert sein soll.

custom_docker_image
str
Erforderlich

Der Name des Docker-Images, mit dem das für das Training zu verwendende Image erstellt wird. Wenn diese Einstellung nicht festgelegt ist, wird als Basisimage ein CPU-basiertes Standardimage verwendet.

image_registry_details
ContainerRegistry
Erforderlich

Die Details der Docker-Imageregistrierung

user_managed
bool
Erforderlich

Gibt an, ob Azure Machine Learning eine vorhandene Python-Umgebung wiederverwendet Bei einer Festlegung auf FALSE erstellt Azure Machine Learning eine Python-Umgebung basierend auf der Spezifikation der Conda-Abhängigkeiten.

conda_packages
list
Erforderlich

Eine Liste von Zeichenfolgen, die Conda-Pakete darstellen, die der Python-Umgebung für das Experiment hinzugefügt werden sollen

pip_packages
list
Erforderlich

Eine Liste von Zeichenfolgen, die pip-Pakete darstellen, die der Python-Umgebung für das Experiment hinzugefügt werden sollen

conda_dependencies_file_path
str
Erforderlich

Eine Zeichenfolge, die den relativen Pfad zur YAML-Datei der Conda-Abhängigkeiten darstellt. Falls angegeben, installiert Azure Machine Learning keine frameworkbezogenen Pakete. Dieser kann in Kombination mit dem Parameter conda_packages bereitgestellt werden. VERALTET. Verwenden Sie den Parameter conda_dependencies_file.

pip_requirements_file_path
str
Erforderlich

Eine Zeichenfolge, die den relativen Pfad zur Pip-Anforderungstextdatei darstellt. Dieser kann in Kombination mit dem Parameter pip_packages bereitgestellt werden. VERALTET. Verwenden Sie den Parameter pip_requirements_file.

conda_dependencies_file
str
Erforderlich

Eine Zeichenfolge, die den relativen Pfad zur YAML-Datei der Conda-Abhängigkeiten darstellt. Falls angegeben, installiert Azure Machine Learning keine frameworkbezogenen Pakete. Dieser kann in Kombination mit dem Parameter conda_packages bereitgestellt werden.

pip_requirements_file
str
Erforderlich

Eine Zeichenfolge, die den relativen Pfad zur Pip-Anforderungstextdatei darstellt. Dieser kann in Kombination mit dem Parameter pip_packages bereitgestellt werden.

environment_variables
dict
Erforderlich

Ein Wörterbuch mit Umgebungsvariablennamen und Werten. Diese Umgebungsvariablen werden für den Prozess festgelegt, in dem das Benutzerskript ausgeführt wird.

environment_definition
Environment
Erforderlich

Die Umgebungsdefinition für ein Experiment umfasst „PythonSection“, „DockerSection“ und Umgebungsvariablen. Jede Umgebungsoption, die nicht direkt über andere Parameter für die Erstellung des Schätzers verfügbar gemacht wird, kann mit dem Parameter environment_definition festgelegt werden. Wenn dieser Parameter angegeben wird, hat er Vorrang vor anderen umgebungsbezogenen Parametern wie use_gpu, custom_docker_image, conda_packages oder pip_packages. Bei ungültigen Kombinationen werden Fehler gemeldet.

inputs
list
Erforderlich

Eine Liste der azureml.data.data_reference. DataReference-Objekte, die als Eingabe verwendet werden sollen.

shm_size
str
Erforderlich

Größe des freigegebenen Speicherblocks des Docker-Containers. Wenn diese Einstellung nicht festgelegt ist, wird die Standardgröße „azureml.core.environment._DEFAULT_SHM_SIZE“ verwendet.

resume_from
DataPath
Erforderlich

Der Datenpfad, der die Prüfpunkt- oder Modelldateien enthält, aus denen das Experiment fortgesetzt werden soll

max_run_duration_seconds
int
Erforderlich

Die maximal zulässige Zeit für die Ausführung Azure Machine Learning versucht, die Ausführung automatisch abzubrechen, wenn sie länger dauert als dieser Wert angibt.

framework_version
str
Erforderlich

Die Scikit-learn-Version, die zum Ausführen von Trainingscode verwendet werden soll. SKLearn.get_supported_versions() gibt eine Liste der vom aktuellen SDK unterstützten Versionen zurück.

_enable_optimized_mode
bool
Erforderlich

Aktivieren Sie den inkrementellen Umgebungsbuild mit vordefinierten Frameworkimages für eine schnellere Umgebungsvorbereitung. Ein vordefiniertes Frameworkimage basiert auf azure ML-Standard-CPU-/GPU-Basisimages mit vorinstallierten Frameworkabhängigkeiten.

_disable_validation
bool
Erforderlich

Deaktivieren Sie die Skriptüberprüfung vor der Übermittlung. Der Standardwert ist True.

_show_lint_warnings
bool
Erforderlich

Anzeigen von Skript-Lintingwarnungen. Die Standardeinstellung lautet „false“.

_show_package_warnings
bool
Erforderlich

Paketvalidierungswarnungen anzeigen. Die Standardeinstellung lautet „false“.

Hinweise

Beim Übermitteln eines Trainingsauftrags führt Azure Machine Learning Ihr Skript in einer Conda-Umgebung innerhalb eines Docker-Containers aus. Für SKLearn-Container werden die folgenden Abhängigkeiten installiert.

Abhängigkeiten | Scikit-learn 0.20.3 | ———————- | —————– | Python | 3.6.2 | azureml-defaults | Neueste | IntelMpi | 2018.3.222 | scikit-learn | 0.20.3 | numpy | 1.16.2 | miniconda | 4.5.11 | scipy | 1.2.1 | joblib | 0.13.2 | git | 2.7.4 |

Die Docker-Images erweitern Ubuntu 16.04.

Wenn Sie zusätzliche Abhängigkeiten installieren müssen, können Sie entweder die Parameter pip_packages oder conda_packages verwenden oder Ihre pip_requirements_file- oder conda_dependencies_file-Datei angeben. Alternativ können Sie ein eigenes Image erstellen und den Parameter custom_docker_image an den Schätzerkonstruktor übergeben.

Attribute

DEFAULT_VERSION

DEFAULT_VERSION = '0.20.3'

FRAMEWORK_NAME

FRAMEWORK_NAME = 'SKLearn'