Condividi tramite


OutputPortBinding Classe

Definisce un output denominato di un passaggio della pipeline.

OutputPortBinding può essere usato per specificare il tipo di dati che verrà prodotto da un passaggio e come verranno generati i dati. Può essere usato con InputPortBinding per specificare che l'output del passaggio è un input obbligatorio di un altro passaggio.

Inizializzare OutputPortBinding.

Ereditarietà
builtins.object
OutputPortBinding

Costruttore

OutputPortBinding(name, datastore=None, output_name=None, bind_mode='mount', path_on_compute=None, is_directory=None, overwrite=None, data_type=None, pipeline_output_name=None, training_output=None, dataset_registration=None, dataset_output=None)

Parametri

Nome Descrizione
name
Necessario
str

Nome dell'oggetto OutputPortBinding, che può contenere solo lettere, cifre e caratteri di sottolineatura.

datastore

L'archivio dati pipelineData risiederà in.

Valore predefinito: None
output_name
str

Nome dell'output, se viene usato nessun nome. Può contenere solo lettere, cifre e caratteri di sottolineatura.

Valore predefinito: None
bind_mode
str

Specifica se il passaggio di produzione userà il metodo "upload" o "mount" o "hdfs" per accedere ai dati.

Valore predefinito: mount
path_on_compute
str

Per la modalità "caricamento", il percorso in cui il modulo scrive l'output.

Valore predefinito: None
is_directory

Se l'output è una directory o un singolo file.

Valore predefinito: None
overwrite

Per la modalità "caricamento", se sovrascrivere i dati esistenti.

Valore predefinito: None
data_type
str

Facoltativa. Il tipo di dati può essere usato per specificare il tipo previsto dell'output e per dettagliare il modo in cui l'utilizzo dei passaggi deve usare i dati. Può essere una stringa definita dall'utente.

Valore predefinito: None
pipeline_output_name
str

Se l'output specificato sarà disponibile usando PipelineRun.get_pipeline_output(). I nomi di output della pipeline devono essere univoci nella pipeline.

Valore predefinito: None
training_output

Definisce l'output per il risultato del training. Questa operazione è necessaria solo per training specifici che comportano diversi tipi di output, ad esempio metriche e modello. Ad esempio, AutoMLStep viene restituita la metrica e il modello. È anche possibile definire iterazioni o metriche di training specifiche usate per ottenere un modello ottimale. Per HyperDriveStep, è anche possibile definire i file di modello specifici da includere nell'output.

Valore predefinito: None
dataset_registration

Facoltativa. Si tratta di un parametro interno. È consigliabile usare PipelineData.as_dataset.

Valore predefinito: None
dataset_output

Facoltativa. Si tratta di un parametro interno. È consigliabile usare OutputFileDatasetConfig intead.

Valore predefinito: None
name
Necessario
str

Nome dell'oggetto OutputPortBinding, che può contenere solo lettere, cifre e caratteri di sottolineatura.

datastore
Necessario

L'archivio dati pipelineData risiederà in.

output_name
Necessario
str

Nome dell'output, se viene usato nessun nome. Può contenere solo lettere, cifre e caratteri di sottolineatura.

bind_mode
Necessario
str

Specifica se il passaggio di produzione userà il metodo "upload" o "mount" o "hdfs" per accedere ai dati.

path_on_compute
Necessario
str

Per la modalità "caricamento", il percorso in cui il modulo scrive l'output.

is_directory
Necessario

se l'output è una directory

overwrite
Necessario

Per la modalità "caricamento", se sovrascrivere i dati esistenti.

data_type
Necessario
str

Facoltativa. Il tipo di dati può essere usato per specificare il tipo previsto dell'output e per dettagliare il modo in cui l'utilizzo dei passaggi deve usare i dati. Può essere una stringa definita dall'utente.

pipeline_output_name
Necessario
str

Se l'output specificato sarà disponibile usando PipelineRun.get_pipeline_output(). I nomi di output della pipeline devono essere univoci nella pipeline.

training_output
Necessario

Definisce l'output per il risultato del training. Questa operazione è necessaria solo per training specifici che comportano diversi tipi di output, ad esempio metriche e modello. Ad esempio, AutoMLStep viene restituita la metrica e il modello. È anche possibile definire iterazioni o metriche di training specifiche usate per ottenere un modello ottimale. Per HyperDriveStep, è anche possibile definire i file di modello specifici da includere nell'output.

dataset_registration
Necessario

Facoltativa. Si tratta di un parametro interno. È consigliabile usare PipelineData.as_dataset.

dataset_output
Necessario

Facoltativa. Si tratta di un parametro interno. È consigliabile usare OutputFileDatasetConfig intead.

Commenti

OutputPortBinding può essere usato in modo simile alla PipelineData creazione di una pipeline per specificare input e output dei passaggi. La differenza è OutputPortBinding deve essere usata per poter essere utilizzata InputPortBinding come input per un altro passaggio.

Un esempio per costruire una pipeline con OutputPortBinding è il seguente:


   from azureml.pipeline.core import OutputPortBinding, InputPortBinding, Pipeline
   from azureml.pipeline.steps import PythonScriptStep

   step_1_output = OutputPortBinding("output", datastore=datastore)

   step_1 = PythonScriptStep(
       name='process data',
       script_name="process_data.py",
       compute_target=compute,
       arguments=["--output", step_1_output],
       outputs=[step_1_output]
   )

   step_2_input = InputPortBinding("input", bind_object=step_1_output)

   step_2 = PythonScriptStep(
       name='train',
       script_name="train.py",
       compute_target=compute,
       arguments=["--input", step_2_input],
       inputs=[step_2_input]
   )

   pipeline = Pipeline(workspace=workspace, steps=[step_1, step_2])

Verrà creata una pipeline con due passaggi. Il passaggio del processo verrà eseguito prima, quindi dopo il completamento, verrà eseguito il passaggio di training. Azure ML fornirà l'output prodotto dal passaggio del processo, come descritto dall'oggetto OutputPortBinding, al passaggio di training.

Attributi

bind_mode

Ottenere la modalità ("upload" o "mount" o "hdfs") il passaggio di produzione userà per creare i dati.

Restituisce

Tipo Descrizione
str

Modalità di associazione.

data_type

Ottenere il tipo di dati che verranno prodotti.

Restituisce

Tipo Descrizione
str

Nome del tipo di dati.

dataset_registration

Ottenere le informazioni di registrazione del set di dati.

Restituisce

Tipo Descrizione

Informazioni di registrazione del set di dati.

datastore

L'archivio dati pipelineData risiederà in.

Restituisce

Tipo Descrizione

Oggetto Datastore.

is_directory

Indica se l'output è una directory.

Restituisce

Tipo Descrizione

is_directory

name

Nome dell'oggetto OutputPortBinding.

Restituisce

Tipo Descrizione
str

Nome.

overwrite

Per la modalità "caricamento", indicare se sovrascrivere i dati esistenti.

Restituisce

Tipo Descrizione

_Sovrascrivere

path_on_compute

Per la modalità "caricamento", il percorso in cui il modulo scrive l'output.

Restituisce

Tipo Descrizione
str

path_on_compute

pipeline_output_name

Ottenere il nome dell'output della pipeline corrispondente a questo OutputPortBinding.

Restituisce

Tipo Descrizione
str

Nome dell'output della pipeline.

training_output

Ottenere l'output di training.

Restituisce

Tipo Descrizione

Output del training