OutputPortBinding Classe
Définit une sortie nommée d’une étape de pipeline.
OutputPortBinding peut être utilisé pour spécifier le type de données qui sera produit par une étape et la façon dont les données seront produites. Il peut être utilisé avec InputPortBinding pour spécifier que la sortie de l’étape est une entrée obligatoire d’une autre étape.
Initialisez OutputPortBinding.
- Héritage
-
builtins.objectOutputPortBinding
Constructeur
OutputPortBinding(name, datastore=None, output_name=None, bind_mode='mount', path_on_compute=None, is_directory=None, overwrite=None, data_type=None, pipeline_output_name=None, training_output=None, dataset_registration=None, dataset_output=None)
Paramètres
- name
- str
Nom de l’objet OutputPortBinding, qui ne peut contenir que des lettres, des chiffres et des traits de soulignement.
- datastore
- Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]
Magasin de données dans lequel réside PipelineData.
- output_name
- str
Nom de la sortie, si aucun nom (None) n’est utilisé. Ne peut contenir que des lettres, des chiffres et des traits de soulignement.
- bind_mode
- str
Spécifie si l’étape de production utilisera la méthode « upload », « mount » ou « hdfs » pour accéder aux données.
- path_on_compute
- str
Pour le mode « upload », chemin où le module écrit la sortie.
- is_directory
- bool
Indique si la sortie est un répertoire ou un fichier unique.
- overwrite
- bool
Pour le mode « upload », indique s’il est nécessaire de remplacer les données existantes.
- data_type
- str
facultatif. Vous pouvez utiliser le type de données pour spécifier le type attendu de la sortie et pour détailler la façon dont les étapes de consommation doivent utiliser les données. Il peut s’agir de n’importe quelle chaîne définie par l’utilisateur.
- pipeline_output_name
- str
Si cette valeur est fournie, cette sortie sera disponible à l’aide de PipelineRun.get_pipeline_output(). Les noms de sortie du pipeline doivent être uniques dans le pipeline.
- training_output
- TrainingOutput
Définit la sortie du résultat de la formation. Uniquement nécessaire pour les formations spécifiques qui aboutissent à différents types de sorties, comme des métriques et un modèle. Par exemple, AutoMLStep aboutit à des métriques et un modèle. Vous pouvez également définir une itération ou une métrique de formation spécifique pour obtenir le meilleur modèle possible. Pour HyperDriveStep, vous pouvez également définir les fichiers de modèle spécifiques à inclure dans la sortie.
- dataset_registration
- DatasetRegistration
facultatif. Il s’agit d’un paramètre interne. Utilisez plutôt PipelineData.as_dataset.
- dataset_output
- OutputDatasetConfig
facultatif. Il s’agit d’un paramètre interne. Utilisez plutôt OutputFileDatasetConfig.
- name
- str
Nom de l’objet OutputPortBinding, qui ne peut contenir que des lettres, des chiffres et des traits de soulignement.
- datastore
- Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]
Magasin de données dans lequel réside PipelineData.
- output_name
- str
Nom de la sortie, si aucun nom (None) n’est utilisé. Peut contenir uniquement des lettres, des chiffres et des traits de soulignement.
- bind_mode
- str
Spécifie si l’étape de production utilisera la méthode « upload », « mount » ou « hdfs » pour accéder aux données.
- overwrite
- bool
Pour le mode « upload », indique s’il est nécessaire de remplacer les données existantes.
- data_type
- str
facultatif. Vous pouvez utiliser le type de données pour spécifier le type attendu de la sortie et pour détailler la façon dont les étapes de consommation doivent utiliser les données. Il peut s’agir de n’importe quelle chaîne définie par l’utilisateur.
- pipeline_output_name
- str
Si cette valeur est fournie, cette sortie sera disponible à l’aide de PipelineRun.get_pipeline_output(). Les noms de sortie du pipeline doivent être uniques dans le pipeline.
- training_output
- TrainingOutput
Définit la sortie du résultat de la formation. Uniquement nécessaire pour les formations spécifiques qui aboutissent à différents types de sorties, comme des métriques et un modèle. Par exemple, AutoMLStep aboutit à des métriques et un modèle. Vous pouvez également définir une itération ou une métrique de formation spécifique pour obtenir le meilleur modèle possible. Pour HyperDriveStep, vous pouvez également définir les fichiers de modèle spécifiques à inclure dans la sortie.
- dataset_registration
- DatasetRegistration
facultatif. Il s’agit d’un paramètre interne. Utilisez plutôt PipelineData.as_dataset.
- dataset_output
- OutputDatasetConfig
facultatif. Il s’agit d’un paramètre interne. Utilisez plutôt OutputFileDatasetConfig.
Remarques
OutputPortBinding peut être utilisé de la même façon que PipelineData lors de la création d’un pipeline pour spécifier des entrées et sorties d’étape. La différence est que OutputPortBinding doit être utilisé avec InputPortBinding pour être consommé comme entrée d’une autre étape.
Voici un exemple de construction d’un pipeline avec OutputPortBinding :
from azureml.pipeline.core import OutputPortBinding, InputPortBinding, Pipeline
from azureml.pipeline.steps import PythonScriptStep
step_1_output = OutputPortBinding("output", datastore=datastore)
step_1 = PythonScriptStep(
name='process data',
script_name="process_data.py",
compute_target=compute,
arguments=["--output", step_1_output],
outputs=[step_1_output]
)
step_2_input = InputPortBinding("input", bind_object=step_1_output)
step_2 = PythonScriptStep(
name='train',
script_name="train.py",
compute_target=compute,
arguments=["--input", step_2_input],
inputs=[step_2_input]
)
pipeline = Pipeline(workspace=workspace, steps=[step_1, step_2])
Cela permet de créer un pipeline en deux étapes. L’étape de traitement est exécutée en premier. Une fois qu’elle a été effectuée, l’étape de formation est exécutée. Azure ML fournit la sortie produite par l’étape de traitement, comme décrit par l’objet OutputPortBinding, à l’étape de formation.
Attributs
bind_mode
Obtient le mode (« upload » ou « mount » ou « hdfs ») à utiliser par l’étape de production pour créer les données.
Retours
Mode de liaison.
Type de retour
data_type
dataset_registration
Obtient les informations d’inscription du jeu de données.
Retours
Informations d’inscription du jeu de données.
Type de retour
datastore
Magasin de données dans lequel réside PipelineData.
Retours
Objet Datastore.
Type de retour
is_directory
name
overwrite
Pour le mode « upload », indique s’il est nécessaire de remplacer les données existantes.
Retours
_overwrite
Type de retour
path_on_compute
Pour le mode « upload », chemin où le module écrit la sortie.
Retours
path_on_compute
Type de retour
pipeline_output_name
Obtient le nom de la sortie de pipeline correspondant à cet objet OutputPortBinding.
Retours
Nom de la sortie de pipeline.
Type de retour
training_output
Commentaires
https://aka.ms/ContentUserFeedback.
Bientôt disponible : Tout au long de 2024, nous allons supprimer progressivement GitHub Issues comme mécanisme de commentaires pour le contenu et le remplacer par un nouveau système de commentaires. Pour plus d’informations, consultezEnvoyer et afficher des commentaires pour