OutputPortBinding Clase

Define una salida con nombre de un paso de canalización.

OutputPortBinding se puede usar para especificar el tipo de datos que se producirá mediante un paso y cómo se producirán los datos. Se puede usar con InputPortBinding para especificar que la salida del paso sea una entrada necesaria de otro paso.

Inicialice OutputPortBinding.

Herencia
builtins.object
OutputPortBinding

Constructor

OutputPortBinding(name, datastore=None, output_name=None, bind_mode='mount', path_on_compute=None, is_directory=None, overwrite=None, data_type=None, pipeline_output_name=None, training_output=None, dataset_registration=None, dataset_output=None)

Parámetros

name
str
Requerido

Nombre del objeto OutputPortBinding, que solo puede contener letras, dígitos y caracteres de subrayado.

datastore
Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]
valor predeterminado: None

Almacén de datos en el que residirá PipelineData.

output_name
str
valor predeterminado: None

Nombre de la salida, si se usa el nombre None. Solo puede contener letras, dígitos y caracteres de subrayado.

bind_mode
str
valor predeterminado: mount

Especifica si el paso de producción usará el método "upload", "mount" o "hdfs" para acceder a los datos.

path_on_compute
str
valor predeterminado: None

Para el modo "upload", la ruta de acceso en la que el módulo escribe la salida.

is_directory
bool
valor predeterminado: None

Si la salida es un directorio o un único archivo.

overwrite
bool
valor predeterminado: None

Para el modo "upload", si se van a sobrescribir los datos existentes.

data_type
str
valor predeterminado: None

Opcional. El tipo de datos se puede usar para especificar el tipo esperado de la salida y para detallar cómo los pasos de consumo deben usar los datos. Puede ser cualquier cadena definida por el usuario.

pipeline_output_name
str
valor predeterminado: None

Si se proporciona, esta salida estará disponible mediante PipelineRun.get_pipeline_output(). Los nombres de salida de canalización deben ser únicos en la canalización.

training_output
TrainingOutput
valor predeterminado: None

Define la salida del resultado del entrenamiento. Esto solo es necesario para entrenamientos específicos que dan lugar a diferentes tipos de salidas, como métricas y modelo. Por ejemplo, AutoMLStep da lugar a métricas y modelo. También puede definir una iteración de entrenamiento específica o una métrica que se usa para obtener el mejor modelo. Para HyperDriveStep, también puede definir los archivos de modelo específicos que se incluirán en la salida.

dataset_registration
DatasetRegistration
valor predeterminado: None

Opcional. Se trata de un parámetro interno. En su lugar, debe usar PipelineData.as_dataset.

dataset_output
OutputDatasetConfig
valor predeterminado: None

Opcional. Se trata de un parámetro interno. En su lugar, debe usar OutputFileDatasetConfig.

name
str
Requerido

Nombre del objeto OutputPortBinding, que solo puede contener letras, dígitos y caracteres de subrayado.

datastore
Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]
Requerido

Almacén de datos en el que residirá PipelineData.

output_name
str
Requerido

Nombre de la salida, si se usa el nombre None. Solo puede contener letras, dígitos y caracteres de subrayado.

bind_mode
str
Requerido

Especifica si el paso de producción usará el método "upload", "mount" o "hdfs" para acceder a los datos.

path_on_compute
str
Requerido

Para el modo "upload", la ruta de acceso en la que el módulo escribe la salida.

is_directory
bool
Requerido

si la salida es un directorio

overwrite
bool
Requerido

Para el modo "upload", si se van a sobrescribir los datos existentes.

data_type
str
Requerido

Opcional. El tipo de datos se puede usar para especificar el tipo esperado de la salida y para detallar cómo los pasos de consumo deben usar los datos. Puede ser cualquier cadena definida por el usuario.

pipeline_output_name
str
Requerido

Si se proporciona, esta salida estará disponible mediante PipelineRun.get_pipeline_output(). Los nombres de salida de canalización deben ser únicos en la canalización.

training_output
TrainingOutput
Requerido

Define la salida del resultado del entrenamiento. Esto solo es necesario para entrenamientos específicos que dan lugar a diferentes tipos de salidas, como métricas y modelo. Por ejemplo, AutoMLStep da lugar a métricas y modelo. También puede definir una iteración de entrenamiento específica o una métrica que se usa para obtener el mejor modelo. Para HyperDriveStep, también puede definir los archivos de modelo específicos que se incluirán en la salida.

dataset_registration
DatasetRegistration
Requerido

Opcional. Se trata de un parámetro interno. En su lugar, debe usar PipelineData.as_dataset.

dataset_output
OutputDatasetConfig
Requerido

Opcional. Se trata de un parámetro interno. En su lugar, debe usar OutputFileDatasetConfig.

Comentarios

OutputPortBinding se puede usar de forma similar a PipelineData cuando se compila una canalización para especificar entradas y salidas de pasos. La diferencia es que OutputPortBinding debe usarse con InputPortBinding para poder consumirse como entrada en otro paso.

A continuación se muestra un ejemplo para construir una canalización con OutputPortBinding:


   from azureml.pipeline.core import OutputPortBinding, InputPortBinding, Pipeline
   from azureml.pipeline.steps import PythonScriptStep

   step_1_output = OutputPortBinding("output", datastore=datastore)

   step_1 = PythonScriptStep(
       name='process data',
       script_name="process_data.py",
       compute_target=compute,
       arguments=["--output", step_1_output],
       outputs=[step_1_output]
   )

   step_2_input = InputPortBinding("input", bind_object=step_1_output)

   step_2 = PythonScriptStep(
       name='train',
       script_name="train.py",
       compute_target=compute,
       arguments=["--input", step_2_input],
       inputs=[step_2_input]
   )

   pipeline = Pipeline(workspace=workspace, steps=[step_1, step_2])

Esto creará una canalización con dos pasos. El paso de proceso se ejecutará primero y, después de que se haya completado, se ejecutará el paso de aprendizaje. Azure ML proporcionará la salida producida por el paso de proceso, como se describe en el objeto OutputPortBinding, al paso de aprendizaje.

Atributos

bind_mode

Obtenga el modo ("upload", "mount" o "hdfs") que usará el paso de producción para crear los datos.

Devoluciones

Modo de enlace.

Tipo de valor devuelto

str

data_type

Obtenga el tipo de datos que se producirá.

Devoluciones

El nombre del tipo de datos.

Tipo de valor devuelto

str

dataset_registration

Obtenga la información de registro del conjunto de datos.

Devoluciones

La información de registro del conjunto de datos.

Tipo de valor devuelto

datastore

Almacén de datos en el que residirá PipelineData.

Devoluciones

El objeto del almacén de datos.

Tipo de valor devuelto

Union[<xref:azureml.data.azure_storage_datastore.AbstractAzureStorageDatastore,azureml.data.azure_data_lake_datastore.AzureDataLakeDatastore>]

is_directory

Si la salida es un directorio.

Devoluciones

is_directory

Tipo de valor devuelto

name

Nombre del objeto OutputPortBinding.

Devoluciones

Nombre.

Tipo de valor devuelto

str

overwrite

Para el modo "upload", indique si desea sobrescribir los datos existentes.

Devoluciones

_overwrite

Tipo de valor devuelto

path_on_compute

Para el modo "upload", la ruta de acceso en la que el módulo escribe la salida.

Devoluciones

path_on_compute

Tipo de valor devuelto

str

pipeline_output_name

Obtenga el nombre de la salida de canalización correspondiente a este OutputPortBinding.

Devoluciones

Nombre de salida de la canalización.

Tipo de valor devuelto

str

training_output

Obtenga la salida de entrenamiento.

Devoluciones

Salida de aprendizaje

Tipo de valor devuelto