OutputPortBinding Classe

Référence

Définit une sortie nommée d’une étape de pipeline.

OutputPortBinding peut être utilisé pour spécifier le type de données qui sera produit par une étape et la façon dont les données seront produites. Il peut être utilisé avec InputPortBinding pour spécifier que la sortie de l’étape est une entrée obligatoire d’une autre étape.

Initialisez OutputPortBinding.

Héritage: builtins.object

OutputPortBinding

Constructeur

OutputPortBinding(name, datastore=None, output_name=None, bind_mode='mount', path_on_compute=None, is_directory=None, overwrite=None, data_type=None, pipeline_output_name=None, training_output=None, dataset_registration=None, dataset_output=None)

Paramètres

Nom	Description
name Obligatoire	str Nom de l’objet OutputPortBinding, qui ne peut contenir que des lettres, des chiffres et des traits de soulignement.
datastore	Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore] Magasin de données dans lequel réside PipelineData. Valeur par défaut: None
output_name	str Nom de la sortie, si aucun nom (None) n’est utilisé. Ne peut contenir que des lettres, des chiffres et des traits de soulignement. Valeur par défaut: None
bind_mode	str Spécifie si l’étape de production utilisera la méthode « upload », « mount » ou « hdfs » pour accéder aux données. Valeur par défaut: mount
path_on_compute	str Pour le mode « upload », chemin où le module écrit la sortie. Valeur par défaut: None
is_directory	bool Indique si la sortie est un répertoire ou un fichier unique. Valeur par défaut: None
overwrite	bool Pour le mode « upload », indique s’il est nécessaire de remplacer les données existantes. Valeur par défaut: None
data_type	str facultatif. Vous pouvez utiliser le type de données pour spécifier le type attendu de la sortie et pour détailler la façon dont les étapes de consommation doivent utiliser les données. Il peut s’agir de n’importe quelle chaîne définie par l’utilisateur. Valeur par défaut: None
pipeline_output_name	str Si cette valeur est fournie, cette sortie sera disponible à l’aide de PipelineRun.get_pipeline_output(). Les noms de sortie du pipeline doivent être uniques dans le pipeline. Valeur par défaut: None
training_output	TrainingOutput Définit la sortie du résultat de la formation. Uniquement nécessaire pour les formations spécifiques qui aboutissent à différents types de sorties, comme des métriques et un modèle. Par exemple, AutoMLStep aboutit à des métriques et un modèle. Vous pouvez également définir une itération ou une métrique de formation spécifique pour obtenir le meilleur modèle possible. Pour HyperDriveStep, vous pouvez également définir les fichiers de modèle spécifiques à inclure dans la sortie. Valeur par défaut: None
dataset_registration	DatasetRegistration facultatif. Il s’agit d’un paramètre interne. Utilisez plutôt PipelineData.as_dataset. Valeur par défaut: None
dataset_output	OutputDatasetConfig facultatif. Il s’agit d’un paramètre interne. Utilisez plutôt OutputFileDatasetConfig. Valeur par défaut: None
name Obligatoire	str Nom de l’objet OutputPortBinding, qui ne peut contenir que des lettres, des chiffres et des traits de soulignement.
datastore Obligatoire	Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore] Magasin de données dans lequel réside PipelineData.
output_name Obligatoire	str Nom de la sortie, si aucun nom (None) n’est utilisé. Peut contenir uniquement des lettres, des chiffres et des traits de soulignement.
bind_mode Obligatoire	str Spécifie si l’étape de production utilisera la méthode « upload », « mount » ou « hdfs » pour accéder aux données.
path_on_compute Obligatoire	str Pour le mode « upload », chemin où le module écrit la sortie.
is_directory Obligatoire	bool si la sortie est un répertoire
overwrite Obligatoire	bool Pour le mode « upload », indique s’il est nécessaire de remplacer les données existantes.
data_type Obligatoire	str facultatif. Vous pouvez utiliser le type de données pour spécifier le type attendu de la sortie et pour détailler la façon dont les étapes de consommation doivent utiliser les données. Il peut s’agir de n’importe quelle chaîne définie par l’utilisateur.
pipeline_output_name Obligatoire	str Si cette valeur est fournie, cette sortie sera disponible à l’aide de PipelineRun.get_pipeline_output(). Les noms de sortie du pipeline doivent être uniques dans le pipeline.
training_output Obligatoire	TrainingOutput Définit la sortie du résultat de la formation. Uniquement nécessaire pour les formations spécifiques qui aboutissent à différents types de sorties, comme des métriques et un modèle. Par exemple, AutoMLStep aboutit à des métriques et un modèle. Vous pouvez également définir une itération ou une métrique de formation spécifique pour obtenir le meilleur modèle possible. Pour HyperDriveStep, vous pouvez également définir les fichiers de modèle spécifiques à inclure dans la sortie.
dataset_registration Obligatoire	DatasetRegistration facultatif. Il s’agit d’un paramètre interne. Utilisez plutôt PipelineData.as_dataset.
dataset_output Obligatoire	OutputDatasetConfig facultatif. Il s’agit d’un paramètre interne. Utilisez plutôt OutputFileDatasetConfig.

Remarques

OutputPortBinding peut être utilisé de la même façon que PipelineData lors de la création d’un pipeline pour spécifier des entrées et sorties d’étape. La différence est que OutputPortBinding doit être utilisé avec InputPortBinding pour être consommé comme entrée d’une autre étape.

Voici un exemple de construction d’un pipeline avec OutputPortBinding :


   from azureml.pipeline.core import OutputPortBinding, InputPortBinding, Pipeline
   from azureml.pipeline.steps import PythonScriptStep

   step_1_output = OutputPortBinding("output", datastore=datastore)

   step_1 = PythonScriptStep(
       name='process data',
       script_name="process_data.py",
       compute_target=compute,
       arguments=["--output", step_1_output],
       outputs=[step_1_output]
   )

   step_2_input = InputPortBinding("input", bind_object=step_1_output)

   step_2 = PythonScriptStep(
       name='train',
       script_name="train.py",
       compute_target=compute,
       arguments=["--input", step_2_input],
       inputs=[step_2_input]
   )

   pipeline = Pipeline(workspace=workspace, steps=[step_1, step_2])

Cela permet de créer un pipeline en deux étapes. L’étape de traitement est exécutée en premier. Une fois qu’elle a été effectuée, l’étape de formation est exécutée. Azure ML fournit la sortie produite par l’étape de traitement, comme décrit par l’objet OutputPortBinding, à l’étape de formation.

Attributs

bind_mode

Obtient le mode (« upload » ou « mount » ou « hdfs ») à utiliser par l’étape de production pour créer les données.

Retours

Type	Description
str	Mode de liaison.

data_type

Obtient le type des données à produire.

Retours

Type	Description
str	Nom du type de données.

dataset_registration

Obtient les informations d’inscription du jeu de données.

Retours

Type	Description
DatasetRegistration	Informations d’inscription du jeu de données.

datastore

Magasin de données dans lequel réside PipelineData.

Retours

Type	Description
Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]	Objet Datastore.

is_directory

Indique si la sortie est un répertoire.

Retours

Type	Description
bool	is_directory

name

Nom de l’objet OutputPortBinding.

Retours

Type	Description
str	Nom.

overwrite

Pour le mode « upload », indique s’il est nécessaire de remplacer les données existantes.

Retours

Type	Description
bool	_overwrite

path_on_compute

Pour le mode « upload », chemin où le module écrit la sortie.

Retours

Type	Description
str	path_on_compute

pipeline_output_name

Obtient le nom de la sortie de pipeline correspondant à cet objet OutputPortBinding.

Retours

Type	Description
str	Nom de la sortie de pipeline.

training_output

Obtient la sortie de formation.

Retours

Type	Description
TrainingOutput	Sortie de formation

Partager via

OutputPortBinding Classe

Constructeur

Paramètres

Remarques

Attributs

bind_mode

Retours

data_type

Retours

dataset_registration

Retours

datastore

Retours

is_directory

Retours

name

Retours

overwrite

Retours

path_on_compute

Retours

pipeline_output_name

Retours

training_output

Retours

Commentaires

Ressources supplémentaires