Delen via


OutputPortBinding Klas

Definieert een benoemde uitvoer van een pijplijnstap.

OutputPortBinding kan worden gebruikt om het type gegevens op te geven dat door een stap wordt geproduceerd en hoe de gegevens worden geproduceerd. Deze kan worden gebruikt met InputPortBinding om op te geven dat de uitvoer van de stap een vereiste invoer van een andere stap is.

Initialiseer OutputPortBinding.

Overname
builtins.object
OutputPortBinding

Constructor

OutputPortBinding(name, datastore=None, output_name=None, bind_mode='mount', path_on_compute=None, is_directory=None, overwrite=None, data_type=None, pipeline_output_name=None, training_output=None, dataset_registration=None, dataset_output=None)

Parameters

Name Description
name
Vereist
str

Naam van het Object OutputPortBinding, dat alleen letters, cijfers en onderstrepingstekens mag bevatten.

datastore

Gegevensopslag waarin de PipelineData zich bevindt.

standaardwaarde: None
output_name
str

Naam van de uitvoer, als geen naam wordt gebruikt. Mag alleen letters, cijfers en onderstrepingstekens bevatten.

standaardwaarde: None
bind_mode
str

Hiermee geeft u op of de productiestap de methode 'uploaden' of 'koppelen' of 'hdfs' gebruikt om toegang te krijgen tot de gegevens.

standaardwaarde: mount
path_on_compute
str

Voor de uploadmodus wordt het pad naar de module geschreven.

standaardwaarde: None
is_directory

Of de uitvoer een map of één bestand is.

standaardwaarde: None
overwrite

Voor de 'uploadmodus', of bestaande gegevens moeten worden overschreven.

standaardwaarde: None
data_type
str

Optioneel. Gegevenstype kan worden gebruikt om het verwachte type uitvoer op te geven en om te bepalen hoe gebruiksstappen de gegevens moeten gebruiken. Kan elke door de gebruiker gedefinieerde tekenreeks zijn.

standaardwaarde: None
pipeline_output_name
str

Indien opgegeven, is deze uitvoer beschikbaar met behulp van PipelineRun.get_pipeline_output(). Namen van pijplijnuitvoer moeten uniek zijn in de pijplijn.

standaardwaarde: None
training_output

Hiermee definieert u de uitvoer voor het trainingsresultaat. Dit is alleen nodig voor specifieke trainingen die resulteren in verschillende soorten uitvoer, zoals metrische gegevens en modellen. Resulteert bijvoorbeeld AutoMLStep in metrische gegevens en modellen. U kunt ook specifieke trainingsiteratie of metrische gegevens definiëren die worden gebruikt om het beste model te verkrijgen. Voor HyperDriveStepkunt u ook de specifieke modelbestanden definiëren die moeten worden opgenomen in de uitvoer.

standaardwaarde: None
dataset_registration

Optioneel. Dit is een interne parameter. U moet in plaats daarvan PipelineData.as_dataset gebruiken.

standaardwaarde: None
dataset_output

Optioneel. Dit is een interne parameter. U moet OutputFileDatasetConfig intead gebruiken.

standaardwaarde: None
name
Vereist
str

Naam van het Object OutputPortBinding, dat alleen letters, cijfers en onderstrepingstekens mag bevatten.

datastore
Vereist

Gegevensopslag waarin de PipelineData zich bevindt.

output_name
Vereist
str

Naam van de uitvoer, als geen naam wordt gebruikt. Mag alleen letters, cijfers en onderstrepingstekens bevatten.

bind_mode
Vereist
str

Hiermee geeft u op of de productiestap de methode 'uploaden' of 'koppelen' of 'hdfs' gebruikt om toegang te krijgen tot de gegevens.

path_on_compute
Vereist
str

Voor de uploadmodus wordt het pad naar de module geschreven.

is_directory
Vereist

als de uitvoer een map is

overwrite
Vereist

Voor de 'uploadmodus', of bestaande gegevens moeten worden overschreven.

data_type
Vereist
str

Optioneel. Gegevenstype kan worden gebruikt om het verwachte type uitvoer op te geven en om te bepalen hoe gebruiksstappen de gegevens moeten gebruiken. Kan elke door de gebruiker gedefinieerde tekenreeks zijn.

pipeline_output_name
Vereist
str

Indien opgegeven, is deze uitvoer beschikbaar met behulp van PipelineRun.get_pipeline_output(). Namen van pijplijnuitvoer moeten uniek zijn in de pijplijn.

training_output
Vereist

Hiermee definieert u de uitvoer voor het trainingsresultaat. Dit is alleen nodig voor specifieke trainingen die resulteren in verschillende soorten uitvoer, zoals metrische gegevens en modellen. Resulteert bijvoorbeeld AutoMLStep in metrische gegevens en modellen. U kunt ook specifieke trainingsiteratie of metrische gegevens definiëren die worden gebruikt om het beste model te verkrijgen. Voor HyperDriveStepkunt u ook de specifieke modelbestanden definiëren die moeten worden opgenomen in de uitvoer.

dataset_registration
Vereist

Optioneel. Dit is een interne parameter. U moet in plaats daarvan PipelineData.as_dataset gebruiken.

dataset_output
Vereist

Optioneel. Dit is een interne parameter. U moet OutputFileDatasetConfig intead gebruiken.

Opmerkingen

OutputPortBinding kan op dezelfde manier worden gebruikt als PipelineData bij het bouwen van een pijplijn om stapinvoer en -uitvoer op te geven. Het verschil is dat OutputPortBinding moet worden gebruikt met InputPortBinding om te worden gebruikt als invoer voor een andere stap.

Een voorbeeld voor het maken van een pijplijn met OutputPortBinding is als volgt:


   from azureml.pipeline.core import OutputPortBinding, InputPortBinding, Pipeline
   from azureml.pipeline.steps import PythonScriptStep

   step_1_output = OutputPortBinding("output", datastore=datastore)

   step_1 = PythonScriptStep(
       name='process data',
       script_name="process_data.py",
       compute_target=compute,
       arguments=["--output", step_1_output],
       outputs=[step_1_output]
   )

   step_2_input = InputPortBinding("input", bind_object=step_1_output)

   step_2 = PythonScriptStep(
       name='train',
       script_name="train.py",
       compute_target=compute,
       arguments=["--input", step_2_input],
       inputs=[step_2_input]
   )

   pipeline = Pipeline(workspace=workspace, steps=[step_1, step_2])

Hiermee maakt u een pijplijn met twee stappen. De processtap wordt eerst uitgevoerd en nadat deze is voltooid, wordt de stap train uitgevoerd. Azure ML levert de uitvoer die wordt geproduceerd door de processtap, zoals beschreven door het object OutputPortBinding, voor de stap train.

Kenmerken

bind_mode

Haal de modus ('uploaden' of 'koppelen' of 'hdfs') op die door de productiestap wordt gebruikt om de gegevens te maken.

Retouren

Type Description
str

De bindingsmodus.

data_type

Haal het type gegevens op dat wordt geproduceerd.

Retouren

Type Description
str

De naam van het gegevenstype.

dataset_registration

Haal de registratiegegevens van de gegevensset op.

Retouren

Type Description

De registratiegegevens van de gegevensset.

datastore

Gegevensopslag waarin de PipelineData zich bevindt.

Retouren

Type Description

Het datastore-object.

is_directory

Of de uitvoer een map is.

Retouren

Type Description

is_directory

name

Naam van het Object OutputPortBinding.

Retouren

Type Description
str

De naam.

overwrite

Geef voor de 'uploadmodus' aan of bestaande gegevens moeten worden overschreven.

Retouren

Type Description

_Overschrijven

path_on_compute

Voor de uploadmodus wordt het pad naar de module geschreven.

Retouren

Type Description
str

path_on_compute

pipeline_output_name

Haal de naam op van de pijplijnuitvoer die overeenkomt met deze OutputPortBinding.

Retouren

Type Description
str

De naam van de pijplijnuitvoer.

training_output

Trainingsuitvoer ophalen.

Retouren

Type Description

Trainingsuitvoer