SKLearn Classe
Crée un estimateur pour l’apprentissage dans les expériences Scikit-learn.
DÉPRÉCIÉ. Utilisez l’objet ScriptRunConfig avec votre propre environnement défini ou l’environnement AzureML-Tutorial organisé. Pour une présentation de la configuration de l’expérience SKLearn avec ScriptRunConfig, consultez Effectuer l’apprentissage des modèles scikit-learn à grande échelle avec Azure Machine Learning.
Cet estimateur prend uniquement en charge l’apprentissage d’UC à nœud unique.
Versions prises en charge : 0.20.3
Initialiser un estimateur Scikit-learn.
- Héritage
-
azureml.train.estimator._framework_base_estimator._FrameworkBaseEstimatorSKLearn
Constructeur
SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)
Paramètres
- source_directory
- str
Répertoire local contenant les fichiers de configuration de l’expérience.
- compute_target
- AbstractComputeTarget ou str
Cible de calcul où la formation aura lieu. Il peut s’agir d’un objet ou de la chaîne « local ».
- vm_size
- str
Taille de la machine virtuelle de la cible de calcul qui sera créée pour la formation.
Valeurs prises en charge : toute taille de machine virtuelle Azure.
- vm_priority
- str
Priorité de la machine virtuelle de la cible de calcul qui sera créée pour la formation. Si elle n’est pas spécifiée, la valeur « dedicated » est utilisée.
Valeurs prises en charge : « dedicated » et « lowpriority ».
Prend effet uniquement quand le paramètre vm_size param
est spécifié dans l’entrée.
- entry_script
- str
Chaîne représentant le chemin d’accès relatif au fichier utilisé pour commencer la formation.
- script_params
- dict
Dictionnaire d’arguments de ligne de commande à passer à votre script de formation spécifié dans entry_script
.
- custom_docker_image
- str
Nom de l’image Docker à partir de laquelle l’image à utiliser pour la formation sera générée. Si la valeur n’est pas définie, une image par défaut basée sur l’UC sera utilisée comme image de base.
- user_managed
- bool
Spécifie si Azure ML réutilise un environnement Python existant. La valeur false signifie qu’Azure ML créera un environnement Python en fonction de la spécification des dépendances Conda.
- conda_packages
- list
Liste des chaînes représentant les packages Conda à ajouter à l’environnement Python pour l’expérience.
- pip_packages
- list
Liste des chaînes représentant les packages pip à ajouter à l’environnement Python pour l’expérience.
- conda_dependencies_file_path
- str
Chaîne représentant le chemin relatif du fichier YAML des dépendances conda.
Si la valeur est spécifiée, Azure ML n’installe aucun package associé à une infrastructure.
Peut être fourni en association avec le paramètre conda_packages
.
DÉPRÉCIÉ. Utilise le paramètre conda_dependencies_file
.
- pip_requirements_file_path
- str
Chaîne représentant le chemin relatif du fichier texte des exigences pip.
Peut être fourni en association avec le paramètre pip_packages
.
DÉPRÉCIÉ. Utilise le paramètre pip_requirements_file
.
- conda_dependencies_file
- str
Chaîne représentant le chemin relatif du fichier YAML des dépendances conda.
Si la valeur est spécifiée, Azure ML n’installe aucun package associé à une infrastructure.
Peut être fourni en association avec le paramètre conda_packages
.
- pip_requirements_file
- str
Chaîne représentant le chemin relatif du fichier texte des exigences pip.
Peut être fourni en association avec le paramètre pip_packages
.
- environment_variables
- dict
Dictionnaire des noms et valeurs des variables d’environnement. Ces variables d’environnement sont définies sur le processus où le script utilisateur est en cours d’exécution.
- environment_definition
- Environment
La définition de l’environnement pour une expérience inclut PythonSection, DockerSection et les variables d’environnement. Toute option d’environnement qui n’est pas directement exposée par le biais d’autres paramètres à la construction de l’estimateur peut être définie à l’aide du paramètre environment_definition
. Si ce paramètre est spécifié, il a la priorité sur les autres paramètres liés à l’environnement, comme use_gpu
, custom_docker_image
, conda_packages
ou pip_packages
.
Les erreurs seront signalées pour les combinaisons non valides.
- inputs
- list
Liste d’objets DataReference ou DatasetConsumptionConfig à utiliser comme entrée.
- shm_size
- str
Taille du bloc de mémoire partagée du conteneur Docker. Si la valeur n’est pas définie, la valeur azureml.core.environment._DEFAULT_SHM_SIZE par défaut est utilisée.
- resume_from
- DataPath
Chemin d’accès aux données contenant les fichiers de point de contrôle ou de modèle à partir desquels reprendre l’expérience.
- max_run_duration_seconds
- int
Durée maximale autorisée pour l’exécution. Azure ML tente d’annuler automatiquement l’exécution si elle prend plus de temps que cette valeur.
- framework_version
- str
Version Scikit-learn à utiliser pour exécuter le code de formation.
SKLearn.get_supported_versions()
retourne la liste des versions prises en charge par le SDK actuel.
- source_directory
- str
Répertoire local contenant les fichiers de configuration de l’expérience.
- compute_target
- AbstractComputeTarget ou str
Cible de calcul où la formation aura lieu. Il peut s’agir d’un objet ou de la chaîne « local ».
- vm_size
- str
Taille de la machine virtuelle de la cible de calcul qui sera créée pour la formation. Valeurs prises en charge : toute taille de machine virtuelle Azure.
- vm_priority
- str
Priorité de la machine virtuelle de la cible de calcul qui sera créée pour la formation. Si elle n’est pas spécifiée, la valeur « dedicated » est utilisée.
Valeurs prises en charge : « dedicated » et « lowpriority ».
Prend effet uniquement quand le paramètre vm_size param
est spécifié dans l’entrée.
- entry_script
- str
Chaîne représentant le chemin d’accès relatif au fichier utilisé pour commencer la formation.
- script_params
- dict
Dictionnaire d’arguments de ligne de commande à passer à votre script de formation spécifié dans entry_script
.
- use_docker
- bool
Valeur bool indiquant si l’environnement pour exécuter l’expérience doit être basé sur Docker.
- custom_docker_image
- str
Nom de l’image Docker à partir de laquelle l’image à utiliser pour la formation sera générée. Si la valeur n’est pas définie, une image par défaut basée sur l’UC est utilisée comme image de base.
- user_managed
- bool
Spécifie si Azure ML réutilise un environnement Python existant. La valeur false signifie qu’Azure ML créera un environnement Python en fonction de la spécification des dépendances Conda.
- conda_packages
- list
Liste des chaînes représentant les packages Conda à ajouter à l’environnement Python pour l’expérience.
- pip_packages
- list
Liste des chaînes représentant les packages pip à ajouter à l’environnement Python pour l’expérience.
- conda_dependencies_file_path
- str
Chaîne représentant le chemin relatif du fichier YAML des dépendances conda. Si la valeur est spécifiée, Azure ML n’installe aucun package associé à une infrastructure.
Peut être fourni en association avec le paramètre conda_packages
.
DÉPRÉCIÉ. Utilise le paramètre conda_dependencies_file
.
- pip_requirements_file_path
- str
Chaîne représentant le chemin relatif du fichier texte des exigences pip.
Peut être fourni en association avec le paramètre pip_packages
.
DÉPRÉCIÉ. Utilise le paramètre pip_requirements_file
.
- conda_dependencies_file
- str
Chaîne représentant le chemin relatif du fichier YAML des dépendances conda. Si la valeur est spécifiée, Azure ML n’installe aucun package associé à une infrastructure.
Peut être fourni en association avec le paramètre conda_packages
.
- pip_requirements_file
- str
Chaîne représentant le chemin relatif du fichier texte des exigences pip.
Peut être fourni en association avec le paramètre pip_packages
.
- environment_variables
- dict
Dictionnaire des noms et valeurs des variables d’environnement. Ces variables d’environnement sont définies sur le processus où le script utilisateur est en cours d’exécution.
- environment_definition
- Environment
La définition de l’environnement pour une expérience inclut PythonSection, DockerSection et les variables d’environnement. Toute option d’environnement qui n’est pas directement exposée par le biais d’autres paramètres à la construction de l’estimateur peut être définie à l’aide du paramètre environment_definition
. Si ce paramètre est spécifié, il a la priorité sur les autres paramètres liés à l’environnement, comme use_gpu
, custom_docker_image
, conda_packages
ou pip_packages
.
Les erreurs seront signalées pour les combinaisons non valides.
- inputs
- list
Liste des azureml.data.data_reference. Objets DataReference à utiliser comme entrée.
- shm_size
- str
Taille du bloc de mémoire partagée du conteneur Docker. Si la valeur n’est pas définie, la valeur azureml.core.environment._DEFAULT_SHM_SIZE par défaut est utilisée.
- resume_from
- DataPath
Chemin d’accès aux données contenant les fichiers de point de contrôle ou de modèle à partir desquels reprendre l’expérience.
- max_run_duration_seconds
- int
Durée maximale autorisée pour l’exécution. Azure ML tente d’annuler automatiquement l’exécution si elle prend plus de temps que cette valeur.
- framework_version
- str
Version Scikit-learn à utiliser pour exécuter le code de formation.
SKLearn.get_supported_versions()
retourne la liste des versions prises en charge par le SDK actuel.
- _enable_optimized_mode
- bool
Activez la génération d’environnement incrémentielle avec des images d’infrastructure prédéfinies pour accélérer la préparation de l’environnement. Une image d’infrastructure prédéfinie s’appuie sur des images de base processeur/GPU Par défaut Azure ML avec des dépendances de framework préinstallées.
- _disable_validation
- bool
Désactivez la validation du script avant l’exécution de la soumission. La valeur par défaut est True.
- _show_lint_warnings
- bool
Afficher les avertissements de linting de script. La valeur par défaut est False.
- _show_package_warnings
- bool
Afficher les avertissements de validation de package. La valeur par défaut est False.
Remarques
Pendant l’envoi d’un travail de formation, Azure ML exécute votre script dans un environnement Conda au sein d’un conteneur Docker. Les conteneurs SKLearn ont les dépendances suivantes installées.
Dependencies | Scikit-learn 0.20.3 | ———————- | —————– | Python | 3.6.2 | azureml-defaults | Latest | IntelMpi | 2018.3.222 | scikit-learn | 0.20.3 | numpy | 1.16.2 | miniconda | 4.5.11 | scipy | 1.2.1 | joblib | 0.13.2 | git | 2.7.4 |
Les images Docker étendent Ubuntu 16.04.
Si vous devez installer des dépendances supplémentaires, vous pouvez utiliser les paramètres pip_packages
ou conda_packages
, ou vous pouvez fournir votre fichier pip_requirements_file
ou conda_dependencies_file
. Vous pouvez également créer votre propre image et transmettre le paramètre custom_docker_image
au constructeur de l’estimateur.
Attributs
DEFAULT_VERSION
DEFAULT_VERSION = '0.20.3'
FRAMEWORK_NAME
FRAMEWORK_NAME = 'SKLearn'
Commentaires
https://aka.ms/ContentUserFeedback.
Bientôt disponible : Tout au long de 2024, nous allons supprimer progressivement GitHub Issues comme mécanisme de commentaires pour le contenu et le remplacer par un nouveau système de commentaires. Pour plus d’informations, consultezEnvoyer et afficher des commentaires pour