SKLearn Classe

Crée un estimateur pour l’apprentissage dans les expériences Scikit-learn.

DÉPRÉCIÉ. Utilisez l’objet ScriptRunConfig avec votre propre environnement défini ou l’environnement AzureML-Tutorial organisé. Pour une présentation de la configuration de l’expérience SKLearn avec ScriptRunConfig, consultez Effectuer l’apprentissage des modèles scikit-learn à grande échelle avec Azure Machine Learning.

Cet estimateur prend uniquement en charge l’apprentissage d’UC à nœud unique.

Versions prises en charge : 0.20.3

Initialiser un estimateur Scikit-learn.

Héritage
azureml.train.estimator._framework_base_estimator._FrameworkBaseEstimator
SKLearn

Constructeur

SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)

Paramètres

source_directory
str
Obligatoire

Répertoire local contenant les fichiers de configuration de l’expérience.

compute_target
AbstractComputeTarget ou str
Obligatoire

Cible de calcul où la formation aura lieu. Il peut s’agir d’un objet ou de la chaîne « local ».

vm_size
str
Obligatoire

Taille de la machine virtuelle de la cible de calcul qui sera créée pour la formation.

Valeurs prises en charge : toute taille de machine virtuelle Azure.

vm_priority
str
Obligatoire

Priorité de la machine virtuelle de la cible de calcul qui sera créée pour la formation. Si elle n’est pas spécifiée, la valeur « dedicated » est utilisée.

Valeurs prises en charge : « dedicated » et « lowpriority ».

Prend effet uniquement quand le paramètre vm_size param est spécifié dans l’entrée.

entry_script
str
Obligatoire

Chaîne représentant le chemin d’accès relatif au fichier utilisé pour commencer la formation.

script_params
dict
Obligatoire

Dictionnaire d’arguments de ligne de commande à passer à votre script de formation spécifié dans entry_script.

custom_docker_image
str
Obligatoire

Nom de l’image Docker à partir de laquelle l’image à utiliser pour la formation sera générée. Si la valeur n’est pas définie, une image par défaut basée sur l’UC sera utilisée comme image de base.

image_registry_details
ContainerRegistry
Obligatoire

Détails du registre de l’image Docker.

user_managed
bool
Obligatoire

Spécifie si Azure ML réutilise un environnement Python existant. La valeur false signifie qu’Azure ML créera un environnement Python en fonction de la spécification des dépendances Conda.

conda_packages
list
Obligatoire

Liste des chaînes représentant les packages Conda à ajouter à l’environnement Python pour l’expérience.

pip_packages
list
Obligatoire

Liste des chaînes représentant les packages pip à ajouter à l’environnement Python pour l’expérience.

conda_dependencies_file_path
str
Obligatoire

Chaîne représentant le chemin relatif du fichier YAML des dépendances conda. Si la valeur est spécifiée, Azure ML n’installe aucun package associé à une infrastructure. Peut être fourni en association avec le paramètre conda_packages. DÉPRÉCIÉ. Utilise le paramètre conda_dependencies_file.

pip_requirements_file_path
str
Obligatoire

Chaîne représentant le chemin relatif du fichier texte des exigences pip. Peut être fourni en association avec le paramètre pip_packages. DÉPRÉCIÉ. Utilise le paramètre pip_requirements_file.

conda_dependencies_file
str
Obligatoire

Chaîne représentant le chemin relatif du fichier YAML des dépendances conda. Si la valeur est spécifiée, Azure ML n’installe aucun package associé à une infrastructure. Peut être fourni en association avec le paramètre conda_packages.

pip_requirements_file
str
Obligatoire

Chaîne représentant le chemin relatif du fichier texte des exigences pip. Peut être fourni en association avec le paramètre pip_packages.

environment_variables
dict
Obligatoire

Dictionnaire des noms et valeurs des variables d’environnement. Ces variables d’environnement sont définies sur le processus où le script utilisateur est en cours d’exécution.

environment_definition
Environment
Obligatoire

La définition de l’environnement pour une expérience inclut PythonSection, DockerSection et les variables d’environnement. Toute option d’environnement qui n’est pas directement exposée par le biais d’autres paramètres à la construction de l’estimateur peut être définie à l’aide du paramètre environment_definition. Si ce paramètre est spécifié, il a la priorité sur les autres paramètres liés à l’environnement, comme use_gpu, custom_docker_image, conda_packages ou pip_packages. Les erreurs seront signalées pour les combinaisons non valides.

inputs
list
Obligatoire

Liste d’objets DataReference ou DatasetConsumptionConfig à utiliser comme entrée.

shm_size
str
Obligatoire

Taille du bloc de mémoire partagée du conteneur Docker. Si la valeur n’est pas définie, la valeur azureml.core.environment._DEFAULT_SHM_SIZE par défaut est utilisée.

resume_from
DataPath
Obligatoire

Chemin d’accès aux données contenant les fichiers de point de contrôle ou de modèle à partir desquels reprendre l’expérience.

max_run_duration_seconds
int
Obligatoire

Durée maximale autorisée pour l’exécution. Azure ML tente d’annuler automatiquement l’exécution si elle prend plus de temps que cette valeur.

framework_version
str
Obligatoire

Version Scikit-learn à utiliser pour exécuter le code de formation. SKLearn.get_supported_versions() retourne la liste des versions prises en charge par le SDK actuel.

source_directory
str
Obligatoire

Répertoire local contenant les fichiers de configuration de l’expérience.

compute_target
AbstractComputeTarget ou str
Obligatoire

Cible de calcul où la formation aura lieu. Il peut s’agir d’un objet ou de la chaîne « local ».

vm_size
str
Obligatoire

Taille de la machine virtuelle de la cible de calcul qui sera créée pour la formation. Valeurs prises en charge : toute taille de machine virtuelle Azure.

vm_priority
str
Obligatoire

Priorité de la machine virtuelle de la cible de calcul qui sera créée pour la formation. Si elle n’est pas spécifiée, la valeur « dedicated » est utilisée.

Valeurs prises en charge : « dedicated » et « lowpriority ».

Prend effet uniquement quand le paramètre vm_size param est spécifié dans l’entrée.

entry_script
str
Obligatoire

Chaîne représentant le chemin d’accès relatif au fichier utilisé pour commencer la formation.

script_params
dict
Obligatoire

Dictionnaire d’arguments de ligne de commande à passer à votre script de formation spécifié dans entry_script.

use_docker
bool
Obligatoire

Valeur bool indiquant si l’environnement pour exécuter l’expérience doit être basé sur Docker.

custom_docker_image
str
Obligatoire

Nom de l’image Docker à partir de laquelle l’image à utiliser pour la formation sera générée. Si la valeur n’est pas définie, une image par défaut basée sur l’UC est utilisée comme image de base.

image_registry_details
ContainerRegistry
Obligatoire

Détails du registre d’images Docker.

user_managed
bool
Obligatoire

Spécifie si Azure ML réutilise un environnement Python existant. La valeur false signifie qu’Azure ML créera un environnement Python en fonction de la spécification des dépendances Conda.

conda_packages
list
Obligatoire

Liste des chaînes représentant les packages Conda à ajouter à l’environnement Python pour l’expérience.

pip_packages
list
Obligatoire

Liste des chaînes représentant les packages pip à ajouter à l’environnement Python pour l’expérience.

conda_dependencies_file_path
str
Obligatoire

Chaîne représentant le chemin relatif du fichier YAML des dépendances conda. Si la valeur est spécifiée, Azure ML n’installe aucun package associé à une infrastructure. Peut être fourni en association avec le paramètre conda_packages. DÉPRÉCIÉ. Utilise le paramètre conda_dependencies_file.

pip_requirements_file_path
str
Obligatoire

Chaîne représentant le chemin relatif du fichier texte des exigences pip. Peut être fourni en association avec le paramètre pip_packages. DÉPRÉCIÉ. Utilise le paramètre pip_requirements_file.

conda_dependencies_file
str
Obligatoire

Chaîne représentant le chemin relatif du fichier YAML des dépendances conda. Si la valeur est spécifiée, Azure ML n’installe aucun package associé à une infrastructure. Peut être fourni en association avec le paramètre conda_packages.

pip_requirements_file
str
Obligatoire

Chaîne représentant le chemin relatif du fichier texte des exigences pip. Peut être fourni en association avec le paramètre pip_packages.

environment_variables
dict
Obligatoire

Dictionnaire des noms et valeurs des variables d’environnement. Ces variables d’environnement sont définies sur le processus où le script utilisateur est en cours d’exécution.

environment_definition
Environment
Obligatoire

La définition de l’environnement pour une expérience inclut PythonSection, DockerSection et les variables d’environnement. Toute option d’environnement qui n’est pas directement exposée par le biais d’autres paramètres à la construction de l’estimateur peut être définie à l’aide du paramètre environment_definition. Si ce paramètre est spécifié, il a la priorité sur les autres paramètres liés à l’environnement, comme use_gpu, custom_docker_image, conda_packages ou pip_packages. Les erreurs seront signalées pour les combinaisons non valides.

inputs
list
Obligatoire

Liste des azureml.data.data_reference. Objets DataReference à utiliser comme entrée.

shm_size
str
Obligatoire

Taille du bloc de mémoire partagée du conteneur Docker. Si la valeur n’est pas définie, la valeur azureml.core.environment._DEFAULT_SHM_SIZE par défaut est utilisée.

resume_from
DataPath
Obligatoire

Chemin d’accès aux données contenant les fichiers de point de contrôle ou de modèle à partir desquels reprendre l’expérience.

max_run_duration_seconds
int
Obligatoire

Durée maximale autorisée pour l’exécution. Azure ML tente d’annuler automatiquement l’exécution si elle prend plus de temps que cette valeur.

framework_version
str
Obligatoire

Version Scikit-learn à utiliser pour exécuter le code de formation. SKLearn.get_supported_versions() retourne la liste des versions prises en charge par le SDK actuel.

_enable_optimized_mode
bool
Obligatoire

Activez la génération d’environnement incrémentielle avec des images d’infrastructure prédéfinies pour accélérer la préparation de l’environnement. Une image d’infrastructure prédéfinie s’appuie sur des images de base processeur/GPU Par défaut Azure ML avec des dépendances de framework préinstallées.

_disable_validation
bool
Obligatoire

Désactivez la validation du script avant l’exécution de la soumission. La valeur par défaut est True.

_show_lint_warnings
bool
Obligatoire

Afficher les avertissements de linting de script. La valeur par défaut est False.

_show_package_warnings
bool
Obligatoire

Afficher les avertissements de validation de package. La valeur par défaut est False.

Remarques

Pendant l’envoi d’un travail de formation, Azure ML exécute votre script dans un environnement Conda au sein d’un conteneur Docker. Les conteneurs SKLearn ont les dépendances suivantes installées.

Dependencies | Scikit-learn 0.20.3 | ———————- | —————– | Python | 3.6.2 | azureml-defaults | Latest | IntelMpi | 2018.3.222 | scikit-learn | 0.20.3 | numpy | 1.16.2 | miniconda | 4.5.11 | scipy | 1.2.1 | joblib | 0.13.2 | git | 2.7.4 |

Les images Docker étendent Ubuntu 16.04.

Si vous devez installer des dépendances supplémentaires, vous pouvez utiliser les paramètres pip_packages ou conda_packages, ou vous pouvez fournir votre fichier pip_requirements_file ou conda_dependencies_file. Vous pouvez également créer votre propre image et transmettre le paramètre custom_docker_image au constructeur de l’estimateur.

Attributs

DEFAULT_VERSION

DEFAULT_VERSION = '0.20.3'

FRAMEWORK_NAME

FRAMEWORK_NAME = 'SKLearn'