OutputPortBinding Clase

Referencia

Define una salida con nombre de un paso de canalización.

OutputPortBinding se puede usar para especificar el tipo de datos que se producirá mediante un paso y cómo se producirán los datos. Se puede usar con InputPortBinding para especificar que la salida del paso sea una entrada necesaria de otro paso.

Inicialice OutputPortBinding.

Herencia: builtins.object

OutputPortBinding

Constructor

OutputPortBinding(name, datastore=None, output_name=None, bind_mode='mount', path_on_compute=None, is_directory=None, overwrite=None, data_type=None, pipeline_output_name=None, training_output=None, dataset_registration=None, dataset_output=None)

Parámetros

Nombre	Description
name Requerido	str Nombre del objeto OutputPortBinding, que solo puede contener letras, dígitos y caracteres de subrayado.
datastore	Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore] Almacén de datos en el que residirá PipelineData. Valor predeterminado: None
output_name	str Nombre de la salida, si se usa el nombre None. Solo puede contener letras, dígitos y caracteres de subrayado. Valor predeterminado: None
bind_mode	str Especifica si el paso de producción usará el método "upload", "mount" o "hdfs" para acceder a los datos. Valor predeterminado: mount
path_on_compute	str Para el modo "upload", la ruta de acceso en la que el módulo escribe la salida. Valor predeterminado: None
is_directory	bool Si la salida es un directorio o un único archivo. Valor predeterminado: None
overwrite	bool Para el modo "upload", si se van a sobrescribir los datos existentes. Valor predeterminado: None
data_type	str Opcional. El tipo de datos se puede usar para especificar el tipo esperado de la salida y para detallar cómo los pasos de consumo deben usar los datos. Puede ser cualquier cadena definida por el usuario. Valor predeterminado: None
pipeline_output_name	str Si se proporciona, esta salida estará disponible mediante PipelineRun.get_pipeline_output(). Los nombres de salida de canalización deben ser únicos en la canalización. Valor predeterminado: None
training_output	TrainingOutput Define la salida del resultado del entrenamiento. Esto solo es necesario para entrenamientos específicos que dan lugar a diferentes tipos de salidas, como métricas y modelo. Por ejemplo, AutoMLStep da lugar a métricas y modelo. También puede definir una iteración de entrenamiento específica o una métrica que se usa para obtener el mejor modelo. Para HyperDriveStep, también puede definir los archivos de modelo específicos que se incluirán en la salida. Valor predeterminado: None
dataset_registration	DatasetRegistration Opcional. Se trata de un parámetro interno. En su lugar, debe usar PipelineData.as_dataset. Valor predeterminado: None
dataset_output	OutputDatasetConfig Opcional. Se trata de un parámetro interno. En su lugar, debe usar OutputFileDatasetConfig. Valor predeterminado: None
name Requerido	str Nombre del objeto OutputPortBinding, que solo puede contener letras, dígitos y caracteres de subrayado.
datastore Requerido	Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore] Almacén de datos en el que residirá PipelineData.
output_name Requerido	str Nombre de la salida, si se usa el nombre None. Solo puede contener letras, dígitos y caracteres de subrayado.
bind_mode Requerido	str Especifica si el paso de producción usará el método "upload", "mount" o "hdfs" para acceder a los datos.
path_on_compute Requerido	str Para el modo "upload", la ruta de acceso en la que el módulo escribe la salida.
is_directory Requerido	bool si la salida es un directorio
overwrite Requerido	bool Para el modo "upload", si se van a sobrescribir los datos existentes.
data_type Requerido	str Opcional. El tipo de datos se puede usar para especificar el tipo esperado de la salida y para detallar cómo los pasos de consumo deben usar los datos. Puede ser cualquier cadena definida por el usuario.
pipeline_output_name Requerido	str Si se proporciona, esta salida estará disponible mediante PipelineRun.get_pipeline_output(). Los nombres de salida de canalización deben ser únicos en la canalización.
training_output Requerido	TrainingOutput Define la salida del resultado del entrenamiento. Esto solo es necesario para entrenamientos específicos que dan lugar a diferentes tipos de salidas, como métricas y modelo. Por ejemplo, AutoMLStep da lugar a métricas y modelo. También puede definir una iteración de entrenamiento específica o una métrica que se usa para obtener el mejor modelo. Para HyperDriveStep, también puede definir los archivos de modelo específicos que se incluirán en la salida.
dataset_registration Requerido	DatasetRegistration Opcional. Se trata de un parámetro interno. En su lugar, debe usar PipelineData.as_dataset.
dataset_output Requerido	OutputDatasetConfig Opcional. Se trata de un parámetro interno. En su lugar, debe usar OutputFileDatasetConfig.

Comentarios

OutputPortBinding se puede usar de forma similar a PipelineData cuando se compila una canalización para especificar entradas y salidas de pasos. La diferencia es que OutputPortBinding debe usarse con InputPortBinding para poder consumirse como entrada en otro paso.

A continuación se muestra un ejemplo para construir una canalización con OutputPortBinding:


   from azureml.pipeline.core import OutputPortBinding, InputPortBinding, Pipeline
   from azureml.pipeline.steps import PythonScriptStep

   step_1_output = OutputPortBinding("output", datastore=datastore)

   step_1 = PythonScriptStep(
       name='process data',
       script_name="process_data.py",
       compute_target=compute,
       arguments=["--output", step_1_output],
       outputs=[step_1_output]
   )

   step_2_input = InputPortBinding("input", bind_object=step_1_output)

   step_2 = PythonScriptStep(
       name='train',
       script_name="train.py",
       compute_target=compute,
       arguments=["--input", step_2_input],
       inputs=[step_2_input]
   )

   pipeline = Pipeline(workspace=workspace, steps=[step_1, step_2])

Esto creará una canalización con dos pasos. El paso de proceso se ejecutará primero y, después de que se haya completado, se ejecutará el paso de aprendizaje. Azure ML proporcionará la salida producida por el paso de proceso, como se describe en el objeto OutputPortBinding, al paso de aprendizaje.

Atributos

bind_mode

Obtenga el modo ("upload", "mount" o "hdfs") que usará el paso de producción para crear los datos.

Devoluciones

Tipo	Description
str	Modo de enlace.

data_type

Obtenga el tipo de datos que se producirá.

Devoluciones

Tipo	Description
str	El nombre del tipo de datos.

dataset_registration

Obtenga la información de registro del conjunto de datos.

Devoluciones

Tipo	Description
DatasetRegistration	La información de registro del conjunto de datos.

datastore

Almacén de datos en el que residirá PipelineData.

Devoluciones

Tipo	Description
Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]	El objeto del almacén de datos.

is_directory

Si la salida es un directorio.

Devoluciones

Tipo	Description
bool	is_directory

name

Nombre del objeto OutputPortBinding.

Devoluciones

Tipo	Description
str	Nombre.

overwrite

Para el modo "upload", indique si desea sobrescribir los datos existentes.

Devoluciones

Tipo	Description
bool	_overwrite

path_on_compute

Para el modo "upload", la ruta de acceso en la que el módulo escribe la salida.

Devoluciones

Tipo	Description
str	path_on_compute

pipeline_output_name

Obtenga el nombre de la salida de canalización correspondiente a este OutputPortBinding.

Devoluciones

Tipo	Description
str	Nombre de salida de la canalización.

training_output

Obtenga la salida de entrenamiento.

Devoluciones

Tipo	Description
TrainingOutput	Salida de aprendizaje

Compartir a través de

OutputPortBinding Clase

Constructor

Parámetros

Comentarios

Atributos

bind_mode

Devoluciones

data_type

Devoluciones

dataset_registration

Devoluciones

datastore

Devoluciones

is_directory

Devoluciones

name

Devoluciones

overwrite

Devoluciones

path_on_compute

Devoluciones

pipeline_output_name

Devoluciones

training_output

Devoluciones

Comentarios

Recursos adicionales