EstimatorStep Classe

DÉPRÉCIÉ. Crée une étape de pipeline pour exécuter Estimator pour la formation du modèle Azure ML.

Créez une étape de pipeline Azure ML pour exécuter l’estimateur pour l’apprentissage du modèle Machine Learning.

DÉPRÉCIÉ. Utilisez plutôt CommandStep. Pour obtenir un exemple, consultez Guide pratique de l’exécution de l’apprentissage ML des pipelines avec CommandStep.

Héritage
EstimatorStep

Constructeur

EstimatorStep(name=None, estimator=None, estimator_entry_script_arguments=None, runconfig_pipeline_params=None, inputs=None, outputs=None, compute_target=None, allow_reuse=True, version=None)

Paramètres

name
str
valeur par défaut: None

Nom de l'étape.

estimator
Estimator
valeur par défaut: None

Objet estimateur associé pour cette étape. Peut être un estimateur préconfiguré comme Chainer, PyTorch, TensorFlow ou SKLearn.

estimator_entry_script_arguments
list[str]
valeur par défaut: None

[Obligatoire] Liste des arguments de ligne de commande. Si le script d’entrée de l’estimateur n’accepte pas d’arguments de ligne de commande, définissez cette valeur de paramètre sur une liste vide.

runconfig_pipeline_params
dict[str, PipelineParameter]
valeur par défaut: None

Remplacement des propriétés runconfig au moment de l’exécution à l’aide de paires clé-valeur, chacune comportant le nom de la propriété runconfig et le paramètre PipelineParameter de cette propriété.

Valeurs prises en charge : « NodeCount », « MpiProcessCountPerNode », « TensorflowWorkerCount », « TensorflowParameterServerCount »

inputs
list[Union[PipelineData, PipelineOutputAbstractDataset, DataReference, DatasetConsumptionConfig]]
valeur par défaut: None

Liste des entrées à utiliser.

outputs
list[Union[PipelineData, OutputDatasetConfig, PipelineOutputAbstractDataset]]
valeur par défaut: None

Liste des objets PipelineData.

compute_target
Union[DsvmCompute, AmlCompute, RemoteCompute, str]
valeur par défaut: None

[Obligatoire] Cible de calcul à utiliser.

allow_reuse
bool
valeur par défaut: True

Indique si l’étape doit réutiliser les résultats précédents lorsqu’elle est exécutée avec les mêmes paramètres. La réutilisation est activée par défaut. Si le contenu de l’étape (scripts/dépendances) ainsi que les entrées et les paramètres restent inchangés, la sortie de l’exécution précédente de cette étape est réutilisée. Lors de la réutilisation de l’étape, au lieu de soumettre le travail au calcul, les résultats de l’exécution précédente sont immédiatement mis à la disposition des étapes suivantes. Si vous utilisez des jeux de données Azure Machine Learning comme entrées, la réutilisation est déterminée par le fait que la définition du jeu de données a changé ou pas, non par la modification éventuelle des données sous-jacentes.

version
str
valeur par défaut: None

Balise de version facultative pour indiquer une modification de fonctionnalité pour le module.

name
str
Obligatoire

Nom de l'étape.

estimator
<xref:Estimator>
Obligatoire

Objet estimateur associé pour cette étape. Peut être un estimateur préconfiguré comme Chainer, PyTorch, TensorFlow ou SKLearn.

estimator_entry_script_arguments
[str]
Obligatoire

[Obligatoire] Liste des arguments de ligne de commande. Si le script d’entrée de l’estimateur n’accepte pas d’arguments de ligne de commande, définissez cette valeur de paramètre sur une liste vide.

runconfig_pipeline_params
dict[str, PipelineParameter]
Obligatoire

Remplacement des propriétés runconfig au moment de l’exécution à l’aide de paires clé-valeur, chacune comportant le nom de la propriété runconfig et le paramètre PipelineParameter de cette propriété.

Valeurs prises en charge : « NodeCount », « MpiProcessCountPerNode », « TensorflowWorkerCount », « TensorflowParameterServerCount »

outputs
list[Union[PipelineData, PipelineOutputAbstractDataset]
Obligatoire

Liste des objets PipelineData.

compute_target
Union[DsvmCompute, AmlCompute, RemoteCompute, str]
Obligatoire

[Obligatoire] Cible de calcul à utiliser.

allow_reuse
bool
Obligatoire

Indique si l’étape doit réutiliser les résultats précédents lorsqu’elle est exécutée avec les mêmes paramètres. La réutilisation est activée par défaut. Si le contenu de l’étape (scripts/dépendances) ainsi que les entrées et les paramètres restent inchangés, la sortie de l’exécution précédente de cette étape est réutilisée. Lors de la réutilisation de l’étape, au lieu de soumettre le travail au calcul, les résultats de l’exécution précédente sont immédiatement mis à la disposition des étapes suivantes. Si vous utilisez des jeux de données Azure Machine Learning comme entrées, la réutilisation est déterminée par le fait que la définition du jeu de données a changé ou pas, non par la modification éventuelle des données sous-jacentes.

version
str
Obligatoire

version

Remarques

Notez que les arguments du script d’entrée utilisé dans l’objet Estimator doivent être spécifiés en tant que liste à l’aide du paramètre estimator_entry_script_arguments lors de l’instanciation d’une étape EstimatorStep. Le paramètre d’estimateur script_params accepte un dictionnaire. Toutefois, le paramètre estimator_entry_script_argument attend des arguments sous forme de liste.

L’initialisation d’EstimatorStep implique la spécification d’une liste d’entrées avec le paramètre inputs. Vous n’avez pas besoin de spécifier les entrées avec l’estimateur, mais une exception est levée si vous le faites. Reportez-vous au paramètre inputs pour connaître les types d’entrées autorisées. Vous pouvez aussi spécifier d’éventuelles sorties pour l’étape. Reportez-vous au paramètre outputs pour connaître les types de sorties autorisées.

La meilleure pratique pour l’utilisation d’EstimatorStep consiste à utiliser un dossier distinct pour les scripts et tous les fichiers dépendants associés à l’étape, puis à spécifier ce dossier en tant que source_directory de l’objet Estimator. Cette pratique présente deux avantages. En premier lieu, cela permet de réduire la taille de l’instantané créé pour l’étape, car seuls les éléments nécessaires à l’étape sont capturés. Deuxièmement, la sortie de l’étape d’une exécution précédente peut être réutilisée si aucune modification n’est apportée au source_directory. La présence de modifications déclenche un nouveau chargement de l’instantané.

Méthodes

create_node

Crée un nœud à partir de l’étape d’estimateur et l’ajoute au graphique spécifié.

DÉPRÉCIÉ. Utilisez plutôt CommandStep. Pour obtenir un exemple, consultez Guide pratique de l’exécution de l’apprentissage ML des pipelines avec CommandStep.

Cette méthode n’est pas destinée à être utilisée directement. Lorsqu’un pipeline est instancié avec cette étape, Azure ML transmet automatiquement les paramètres requis via cette méthode afin que l’étape puisse être ajoutée à un graphique de pipeline qui représente le flux de travail.

create_node

Crée un nœud à partir de l’étape d’estimateur et l’ajoute au graphique spécifié.

DÉPRÉCIÉ. Utilisez plutôt CommandStep. Pour obtenir un exemple, consultez Guide pratique de l’exécution de l’apprentissage ML des pipelines avec CommandStep.

Cette méthode n’est pas destinée à être utilisée directement. Lorsqu’un pipeline est instancié avec cette étape, Azure ML transmet automatiquement les paramètres requis via cette méthode afin que l’étape puisse être ajoutée à un graphique de pipeline qui représente le flux de travail.

create_node(graph, default_datastore, context)

Paramètres

graph
Graph
Obligatoire

Objet graphe auquel ajouter le nœud.

default_datastore
Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]
Obligatoire

Magasin de données par défaut.

context
<xref:azureml.pipeline.core._GraphContext>
Obligatoire

Contexte du graphique.

Retours

Nœud créé.

Type de retour