OutputPortBinding Clase
Define una salida con nombre de un paso de canalización.
OutputPortBinding se puede usar para especificar el tipo de datos que se producirá mediante un paso y cómo se producirán los datos. Se puede usar con InputPortBinding para especificar que la salida del paso sea una entrada necesaria de otro paso.
Inicialice OutputPortBinding.
- Herencia
-
builtins.objectOutputPortBinding
Constructor
OutputPortBinding(name, datastore=None, output_name=None, bind_mode='mount', path_on_compute=None, is_directory=None, overwrite=None, data_type=None, pipeline_output_name=None, training_output=None, dataset_registration=None, dataset_output=None)
Parámetros
- name
- str
Nombre del objeto OutputPortBinding, que solo puede contener letras, dígitos y caracteres de subrayado.
- datastore
- Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]
Almacén de datos en el que residirá PipelineData.
- output_name
- str
Nombre de la salida, si se usa el nombre None. Solo puede contener letras, dígitos y caracteres de subrayado.
- bind_mode
- str
Especifica si el paso de producción usará el método "upload", "mount" o "hdfs" para acceder a los datos.
- path_on_compute
- str
Para el modo "upload", la ruta de acceso en la que el módulo escribe la salida.
- overwrite
- bool
Para el modo "upload", si se van a sobrescribir los datos existentes.
- data_type
- str
Opcional. El tipo de datos se puede usar para especificar el tipo esperado de la salida y para detallar cómo los pasos de consumo deben usar los datos. Puede ser cualquier cadena definida por el usuario.
- pipeline_output_name
- str
Si se proporciona, esta salida estará disponible mediante PipelineRun.get_pipeline_output(). Los nombres de salida de canalización deben ser únicos en la canalización.
- training_output
- TrainingOutput
Define la salida del resultado del entrenamiento. Esto solo es necesario para entrenamientos específicos que dan lugar a diferentes tipos de salidas, como métricas y modelo. Por ejemplo, AutoMLStep da lugar a métricas y modelo. También puede definir una iteración de entrenamiento específica o una métrica que se usa para obtener el mejor modelo. Para HyperDriveStep, también puede definir los archivos de modelo específicos que se incluirán en la salida.
- dataset_registration
- DatasetRegistration
Opcional. Se trata de un parámetro interno. En su lugar, debe usar PipelineData.as_dataset.
- dataset_output
- OutputDatasetConfig
Opcional. Se trata de un parámetro interno. En su lugar, debe usar OutputFileDatasetConfig.
- name
- str
Nombre del objeto OutputPortBinding, que solo puede contener letras, dígitos y caracteres de subrayado.
- datastore
- Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]
Almacén de datos en el que residirá PipelineData.
- output_name
- str
Nombre de la salida, si se usa el nombre None. Solo puede contener letras, dígitos y caracteres de subrayado.
- bind_mode
- str
Especifica si el paso de producción usará el método "upload", "mount" o "hdfs" para acceder a los datos.
- path_on_compute
- str
Para el modo "upload", la ruta de acceso en la que el módulo escribe la salida.
- data_type
- str
Opcional. El tipo de datos se puede usar para especificar el tipo esperado de la salida y para detallar cómo los pasos de consumo deben usar los datos. Puede ser cualquier cadena definida por el usuario.
- pipeline_output_name
- str
Si se proporciona, esta salida estará disponible mediante PipelineRun.get_pipeline_output(). Los nombres de salida de canalización deben ser únicos en la canalización.
- training_output
- TrainingOutput
Define la salida del resultado del entrenamiento. Esto solo es necesario para entrenamientos específicos que dan lugar a diferentes tipos de salidas, como métricas y modelo. Por ejemplo, AutoMLStep da lugar a métricas y modelo. También puede definir una iteración de entrenamiento específica o una métrica que se usa para obtener el mejor modelo. Para HyperDriveStep, también puede definir los archivos de modelo específicos que se incluirán en la salida.
- dataset_registration
- DatasetRegistration
Opcional. Se trata de un parámetro interno. En su lugar, debe usar PipelineData.as_dataset.
- dataset_output
- OutputDatasetConfig
Opcional. Se trata de un parámetro interno. En su lugar, debe usar OutputFileDatasetConfig.
Comentarios
OutputPortBinding se puede usar de forma similar a PipelineData cuando se compila una canalización para especificar entradas y salidas de pasos. La diferencia es que OutputPortBinding debe usarse con InputPortBinding para poder consumirse como entrada en otro paso.
A continuación se muestra un ejemplo para construir una canalización con OutputPortBinding:
from azureml.pipeline.core import OutputPortBinding, InputPortBinding, Pipeline
from azureml.pipeline.steps import PythonScriptStep
step_1_output = OutputPortBinding("output", datastore=datastore)
step_1 = PythonScriptStep(
name='process data',
script_name="process_data.py",
compute_target=compute,
arguments=["--output", step_1_output],
outputs=[step_1_output]
)
step_2_input = InputPortBinding("input", bind_object=step_1_output)
step_2 = PythonScriptStep(
name='train',
script_name="train.py",
compute_target=compute,
arguments=["--input", step_2_input],
inputs=[step_2_input]
)
pipeline = Pipeline(workspace=workspace, steps=[step_1, step_2])
Esto creará una canalización con dos pasos. El paso de proceso se ejecutará primero y, después de que se haya completado, se ejecutará el paso de aprendizaje. Azure ML proporcionará la salida producida por el paso de proceso, como se describe en el objeto OutputPortBinding, al paso de aprendizaje.
Atributos
bind_mode
Obtenga el modo ("upload", "mount" o "hdfs") que usará el paso de producción para crear los datos.
Devoluciones
Modo de enlace.
Tipo de valor devuelto
data_type
Obtenga el tipo de datos que se producirá.
Devoluciones
El nombre del tipo de datos.
Tipo de valor devuelto
dataset_registration
Obtenga la información de registro del conjunto de datos.
Devoluciones
La información de registro del conjunto de datos.
Tipo de valor devuelto
datastore
Almacén de datos en el que residirá PipelineData.
Devoluciones
El objeto del almacén de datos.
Tipo de valor devuelto
is_directory
name
overwrite
Para el modo "upload", indique si desea sobrescribir los datos existentes.
Devoluciones
_overwrite
Tipo de valor devuelto
path_on_compute
Para el modo "upload", la ruta de acceso en la que el módulo escribe la salida.
Devoluciones
path_on_compute
Tipo de valor devuelto
pipeline_output_name
Obtenga el nombre de la salida de canalización correspondiente a este OutputPortBinding.
Devoluciones
Nombre de salida de la canalización.
Tipo de valor devuelto
training_output
Obtenga la salida de entrenamiento.
Devoluciones
Salida de aprendizaje
Tipo de valor devuelto
Comentarios
https://aka.ms/ContentUserFeedback.
Próximamente: A lo largo de 2024 iremos eliminando gradualmente GitHub Issues como mecanismo de comentarios sobre el contenido y lo sustituiremos por un nuevo sistema de comentarios. Para más información, vea:Enviar y ver comentarios de