OutputPortBinding Klas
Definieert een benoemde uitvoer van een pijplijnstap.
OutputPortBinding kan worden gebruikt om het type gegevens op te geven dat door een stap wordt geproduceerd en hoe de gegevens worden geproduceerd. Deze kan worden gebruikt met InputPortBinding om op te geven dat de uitvoer van de stap een vereiste invoer van een andere stap is.
Initialiseer OutputPortBinding.
- Overname
-
builtins.objectOutputPortBinding
Constructor
OutputPortBinding(name, datastore=None, output_name=None, bind_mode='mount', path_on_compute=None, is_directory=None, overwrite=None, data_type=None, pipeline_output_name=None, training_output=None, dataset_registration=None, dataset_output=None)
Parameters
Name | Description |
---|---|
name
Vereist
|
Naam van het Object OutputPortBinding, dat alleen letters, cijfers en onderstrepingstekens mag bevatten. |
datastore
|
Gegevensopslag waarin de PipelineData zich bevindt. Default value: None
|
output_name
|
Naam van de uitvoer, als geen naam wordt gebruikt. Mag alleen letters, cijfers en onderstrepingstekens bevatten. Default value: None
|
bind_mode
|
Hiermee geeft u op of de productiestap de methode 'uploaden' of 'koppelen' of 'hdfs' gebruikt om toegang te krijgen tot de gegevens. Default value: mount
|
path_on_compute
|
Voor de uploadmodus wordt het pad naar de module geschreven. Default value: None
|
is_directory
|
Of de uitvoer een map of één bestand is. Default value: None
|
overwrite
|
Voor de 'uploadmodus', of bestaande gegevens moeten worden overschreven. Default value: None
|
data_type
|
Optioneel. Gegevenstype kan worden gebruikt om het verwachte type uitvoer op te geven en om te bepalen hoe gebruiksstappen de gegevens moeten gebruiken. Kan elke door de gebruiker gedefinieerde tekenreeks zijn. Default value: None
|
pipeline_output_name
|
Indien opgegeven, is deze uitvoer beschikbaar met behulp van PipelineRun.get_pipeline_output(). Namen van pijplijnuitvoer moeten uniek zijn in de pijplijn. Default value: None
|
training_output
|
Hiermee definieert u de uitvoer voor het trainingsresultaat. Dit is alleen nodig voor specifieke trainingen die resulteren in verschillende soorten uitvoer, zoals metrische gegevens en modellen. Resulteert bijvoorbeeld AutoMLStep in metrische gegevens en modellen. U kunt ook specifieke trainingsiteratie of metrische gegevens definiëren die worden gebruikt om het beste model te verkrijgen. Voor HyperDriveStepkunt u ook de specifieke modelbestanden definiëren die moeten worden opgenomen in de uitvoer. Default value: None
|
dataset_registration
|
Optioneel. Dit is een interne parameter. U moet in plaats daarvan PipelineData.as_dataset gebruiken. Default value: None
|
dataset_output
|
Optioneel. Dit is een interne parameter. U moet OutputFileDatasetConfig intead gebruiken. Default value: None
|
name
Vereist
|
Naam van het Object OutputPortBinding, dat alleen letters, cijfers en onderstrepingstekens mag bevatten. |
datastore
Vereist
|
Gegevensopslag waarin de PipelineData zich bevindt. |
output_name
Vereist
|
Naam van de uitvoer, als geen naam wordt gebruikt. Mag alleen letters, cijfers en onderstrepingstekens bevatten. |
bind_mode
Vereist
|
Hiermee geeft u op of de productiestap de methode 'uploaden' of 'koppelen' of 'hdfs' gebruikt om toegang te krijgen tot de gegevens. |
path_on_compute
Vereist
|
Voor de uploadmodus wordt het pad naar de module geschreven. |
is_directory
Vereist
|
als de uitvoer een map is |
overwrite
Vereist
|
Voor de 'uploadmodus', of bestaande gegevens moeten worden overschreven. |
data_type
Vereist
|
Optioneel. Gegevenstype kan worden gebruikt om het verwachte type uitvoer op te geven en om te bepalen hoe gebruiksstappen de gegevens moeten gebruiken. Kan elke door de gebruiker gedefinieerde tekenreeks zijn. |
pipeline_output_name
Vereist
|
Indien opgegeven, is deze uitvoer beschikbaar met behulp van PipelineRun.get_pipeline_output(). Namen van pijplijnuitvoer moeten uniek zijn in de pijplijn. |
training_output
Vereist
|
Hiermee definieert u de uitvoer voor het trainingsresultaat. Dit is alleen nodig voor specifieke trainingen die resulteren in verschillende soorten uitvoer, zoals metrische gegevens en modellen. Resulteert bijvoorbeeld AutoMLStep in metrische gegevens en modellen. U kunt ook specifieke trainingsiteratie of metrische gegevens definiëren die worden gebruikt om het beste model te verkrijgen. Voor HyperDriveStepkunt u ook de specifieke modelbestanden definiëren die moeten worden opgenomen in de uitvoer. |
dataset_registration
Vereist
|
Optioneel. Dit is een interne parameter. U moet in plaats daarvan PipelineData.as_dataset gebruiken. |
dataset_output
Vereist
|
Optioneel. Dit is een interne parameter. U moet OutputFileDatasetConfig intead gebruiken. |
Opmerkingen
OutputPortBinding kan op dezelfde manier worden gebruikt als PipelineData bij het bouwen van een pijplijn om stapinvoer en -uitvoer op te geven. Het verschil is dat OutputPortBinding moet worden gebruikt met InputPortBinding om te worden gebruikt als invoer voor een andere stap.
Een voorbeeld voor het maken van een pijplijn met OutputPortBinding is als volgt:
from azureml.pipeline.core import OutputPortBinding, InputPortBinding, Pipeline
from azureml.pipeline.steps import PythonScriptStep
step_1_output = OutputPortBinding("output", datastore=datastore)
step_1 = PythonScriptStep(
name='process data',
script_name="process_data.py",
compute_target=compute,
arguments=["--output", step_1_output],
outputs=[step_1_output]
)
step_2_input = InputPortBinding("input", bind_object=step_1_output)
step_2 = PythonScriptStep(
name='train',
script_name="train.py",
compute_target=compute,
arguments=["--input", step_2_input],
inputs=[step_2_input]
)
pipeline = Pipeline(workspace=workspace, steps=[step_1, step_2])
Hiermee maakt u een pijplijn met twee stappen. De processtap wordt eerst uitgevoerd en nadat deze is voltooid, wordt de stap train uitgevoerd. Azure ML levert de uitvoer die wordt geproduceerd door de processtap, zoals beschreven door het object OutputPortBinding, voor de stap train.
Kenmerken
bind_mode
Haal de modus ('uploaden' of 'koppelen' of 'hdfs') op die door de productiestap wordt gebruikt om de gegevens te maken.
Retouren
Type | Description |
---|---|
De bindingsmodus. |
data_type
Haal het type gegevens op dat wordt geproduceerd.
Retouren
Type | Description |
---|---|
De naam van het gegevenstype. |
dataset_registration
Haal de registratiegegevens van de gegevensset op.
Retouren
Type | Description |
---|---|
De registratiegegevens van de gegevensset. |
datastore
Gegevensopslag waarin de PipelineData zich bevindt.
Retouren
Type | Description |
---|---|
Het datastore-object. |
is_directory
name
overwrite
Geef voor de 'uploadmodus' aan of bestaande gegevens moeten worden overschreven.
Retouren
Type | Description |
---|---|
_Overschrijven |
path_on_compute
Voor de uploadmodus wordt het pad naar de module geschreven.
Retouren
Type | Description |
---|---|
path_on_compute |
pipeline_output_name
Haal de naam op van de pijplijnuitvoer die overeenkomt met deze OutputPortBinding.
Retouren
Type | Description |
---|---|
De naam van de pijplijnuitvoer. |