OutputPortBinding Klas
Definieert een benoemde uitvoer van een pijplijnstap.
OutputPortBinding kan worden gebruikt om het type gegevens op te geven dat door een stap wordt geproduceerd en hoe de gegevens worden geproduceerd. Deze kan worden gebruikt met InputPortBinding om op te geven dat de uitvoer van de stap een vereiste invoer van een andere stap is.
Initialiseer OutputPortBinding.
- Overname
-
builtins.objectOutputPortBinding
Constructor
OutputPortBinding(name, datastore=None, output_name=None, bind_mode='mount', path_on_compute=None, is_directory=None, overwrite=None, data_type=None, pipeline_output_name=None, training_output=None, dataset_registration=None, dataset_output=None)
Parameters
Name | Description |
---|---|
name
Vereist
|
Naam van het Object OutputPortBinding, dat alleen letters, cijfers en onderstrepingstekens mag bevatten. |
datastore
|
Gegevensopslag waarin de PipelineData zich bevindt. standaardwaarde: None
|
output_name
|
Naam van de uitvoer, als geen naam wordt gebruikt. Mag alleen letters, cijfers en onderstrepingstekens bevatten. standaardwaarde: None
|
bind_mode
|
Hiermee geeft u op of de productiestap de methode 'uploaden' of 'koppelen' of 'hdfs' gebruikt om toegang te krijgen tot de gegevens. standaardwaarde: mount
|
path_on_compute
|
Voor de uploadmodus wordt het pad naar de module geschreven. standaardwaarde: None
|
is_directory
|
Of de uitvoer een map of één bestand is. standaardwaarde: None
|
overwrite
|
Voor de 'uploadmodus', of bestaande gegevens moeten worden overschreven. standaardwaarde: None
|
data_type
|
Optioneel. Gegevenstype kan worden gebruikt om het verwachte type uitvoer op te geven en om te bepalen hoe gebruiksstappen de gegevens moeten gebruiken. Kan elke door de gebruiker gedefinieerde tekenreeks zijn. standaardwaarde: None
|
pipeline_output_name
|
Indien opgegeven, is deze uitvoer beschikbaar met behulp van PipelineRun.get_pipeline_output(). Namen van pijplijnuitvoer moeten uniek zijn in de pijplijn. standaardwaarde: None
|
training_output
|
Hiermee definieert u de uitvoer voor het trainingsresultaat. Dit is alleen nodig voor specifieke trainingen die resulteren in verschillende soorten uitvoer, zoals metrische gegevens en modellen. Resulteert bijvoorbeeld AutoMLStep in metrische gegevens en modellen. U kunt ook specifieke trainingsiteratie of metrische gegevens definiëren die worden gebruikt om het beste model te verkrijgen. Voor HyperDriveStepkunt u ook de specifieke modelbestanden definiëren die moeten worden opgenomen in de uitvoer. standaardwaarde: None
|
dataset_registration
|
Optioneel. Dit is een interne parameter. U moet in plaats daarvan PipelineData.as_dataset gebruiken. standaardwaarde: None
|
dataset_output
|
Optioneel. Dit is een interne parameter. U moet OutputFileDatasetConfig intead gebruiken. standaardwaarde: None
|
name
Vereist
|
Naam van het Object OutputPortBinding, dat alleen letters, cijfers en onderstrepingstekens mag bevatten. |
datastore
Vereist
|
Gegevensopslag waarin de PipelineData zich bevindt. |
output_name
Vereist
|
Naam van de uitvoer, als geen naam wordt gebruikt. Mag alleen letters, cijfers en onderstrepingstekens bevatten. |
bind_mode
Vereist
|
Hiermee geeft u op of de productiestap de methode 'uploaden' of 'koppelen' of 'hdfs' gebruikt om toegang te krijgen tot de gegevens. |
path_on_compute
Vereist
|
Voor de uploadmodus wordt het pad naar de module geschreven. |
is_directory
Vereist
|
als de uitvoer een map is |
overwrite
Vereist
|
Voor de 'uploadmodus', of bestaande gegevens moeten worden overschreven. |
data_type
Vereist
|
Optioneel. Gegevenstype kan worden gebruikt om het verwachte type uitvoer op te geven en om te bepalen hoe gebruiksstappen de gegevens moeten gebruiken. Kan elke door de gebruiker gedefinieerde tekenreeks zijn. |
pipeline_output_name
Vereist
|
Indien opgegeven, is deze uitvoer beschikbaar met behulp van PipelineRun.get_pipeline_output(). Namen van pijplijnuitvoer moeten uniek zijn in de pijplijn. |
training_output
Vereist
|
Hiermee definieert u de uitvoer voor het trainingsresultaat. Dit is alleen nodig voor specifieke trainingen die resulteren in verschillende soorten uitvoer, zoals metrische gegevens en modellen. Resulteert bijvoorbeeld AutoMLStep in metrische gegevens en modellen. U kunt ook specifieke trainingsiteratie of metrische gegevens definiëren die worden gebruikt om het beste model te verkrijgen. Voor HyperDriveStepkunt u ook de specifieke modelbestanden definiëren die moeten worden opgenomen in de uitvoer. |
dataset_registration
Vereist
|
Optioneel. Dit is een interne parameter. U moet in plaats daarvan PipelineData.as_dataset gebruiken. |
dataset_output
Vereist
|
Optioneel. Dit is een interne parameter. U moet OutputFileDatasetConfig intead gebruiken. |
Opmerkingen
OutputPortBinding kan op dezelfde manier worden gebruikt als PipelineData bij het bouwen van een pijplijn om stapinvoer en -uitvoer op te geven. Het verschil is dat OutputPortBinding moet worden gebruikt met InputPortBinding om te worden gebruikt als invoer voor een andere stap.
Een voorbeeld voor het maken van een pijplijn met OutputPortBinding is als volgt:
from azureml.pipeline.core import OutputPortBinding, InputPortBinding, Pipeline
from azureml.pipeline.steps import PythonScriptStep
step_1_output = OutputPortBinding("output", datastore=datastore)
step_1 = PythonScriptStep(
name='process data',
script_name="process_data.py",
compute_target=compute,
arguments=["--output", step_1_output],
outputs=[step_1_output]
)
step_2_input = InputPortBinding("input", bind_object=step_1_output)
step_2 = PythonScriptStep(
name='train',
script_name="train.py",
compute_target=compute,
arguments=["--input", step_2_input],
inputs=[step_2_input]
)
pipeline = Pipeline(workspace=workspace, steps=[step_1, step_2])
Hiermee maakt u een pijplijn met twee stappen. De processtap wordt eerst uitgevoerd en nadat deze is voltooid, wordt de stap train uitgevoerd. Azure ML levert de uitvoer die wordt geproduceerd door de processtap, zoals beschreven door het object OutputPortBinding, voor de stap train.
Kenmerken
bind_mode
Haal de modus ('uploaden' of 'koppelen' of 'hdfs') op die door de productiestap wordt gebruikt om de gegevens te maken.
Retouren
Type | Description |
---|---|
De bindingsmodus. |
data_type
Haal het type gegevens op dat wordt geproduceerd.
Retouren
Type | Description |
---|---|
De naam van het gegevenstype. |
dataset_registration
Haal de registratiegegevens van de gegevensset op.
Retouren
Type | Description |
---|---|
De registratiegegevens van de gegevensset. |
datastore
Gegevensopslag waarin de PipelineData zich bevindt.
Retouren
Type | Description |
---|---|
Het datastore-object. |
is_directory
name
overwrite
Geef voor de 'uploadmodus' aan of bestaande gegevens moeten worden overschreven.
Retouren
Type | Description |
---|---|
_Overschrijven |
path_on_compute
Voor de uploadmodus wordt het pad naar de module geschreven.
Retouren
Type | Description |
---|---|
path_on_compute |
pipeline_output_name
Haal de naam op van de pijplijnuitvoer die overeenkomt met deze OutputPortBinding.
Retouren
Type | Description |
---|---|
De naam van de pijplijnuitvoer. |
training_output
Feedback
https://aka.ms/ContentUserFeedback.
Binnenkort beschikbaar: In de loop van 2024 zullen we GitHub-problemen geleidelijk uitfaseren als het feedbackmechanisme voor inhoud en deze vervangen door een nieuw feedbacksysteem. Zie voor meer informatie:Feedback verzenden en weergeven voor