Delen via


ModuleStep Klas

Hiermee maakt u een Azure Machine Learning-pijplijnstap om een specifieke versie van een module uit te voeren.

Module objecten definiëren herbruikbare berekeningen, zoals scripts of uitvoerbare bestanden, die kunnen worden gebruikt in verschillende machine learning-scenario's en door verschillende gebruikers. Als u een specifieke versie van een module in een pijplijn wilt gebruiken, maakt u een modulestap. Een ModuleStep is een stap in de pijplijn die gebruikmaakt van een bestaande ModuleVersion.

Zie het notebook https://aka.ms/pl-modulestepvoor een voorbeeld van het gebruik van ModuleStep.

Maak een Azure ML-pijplijnstap om een specifieke versie van een module uit te voeren.

Overname
ModuleStep

Constructor

ModuleStep(module=None, version=None, module_version=None, inputs_map=None, outputs_map=None, compute_target=None, runconfig=None, runconfig_pipeline_params=None, arguments=None, params=None, name=None, _workflow_provider=None)

Parameters

Name Description
module

De module die in de stap wordt gebruikt. Geef de module parameter of op module_version , maar niet beide.

Default value: None
version
str

De versie van de module die in de stap wordt gebruikt.

Default value: None
module_version

Een ModuleVersie van de module die in de stap wordt gebruikt. Geef de module parameter of op module_version , maar niet beide.

Default value: None
inputs_map

Een woordenlijst die de namen van poortdefinities van de ModuleVersion toewijst aan de invoer van de stap.

Default value: None
outputs_map

Een woordenlijst die de namen van poortdefinities van de ModuleVersion toewijst aan de uitvoer van de stap.

Default value: None
compute_target

Het rekendoel dat moet worden gebruikt. Als dit niet is opgegeven, wordt het doel van de runconfig gebruikt. Dit kan een rekendoelobject zijn of de tekenreeksnaam van een rekendoel in de werkruimte. Als het rekendoel niet beschikbaar is tijdens het maken van de pijplijn, kunt u desgewenst een tuple van opgeven ('naam rekendoel', 'type rekendoel') om te voorkomen dat het rekendoelobject wordt opgehaald (AmlCompute-type is 'AmlCompute' en het type RemoteCompute is 'VirtualMachine').

Default value: None
runconfig

Een optionele RunConfiguration die moet worden gebruikt. Een RunConfiguration kan worden gebruikt om aanvullende vereisten voor de uitvoering op te geven, zoals conda-afhankelijkheden en een Docker-installatiekopieën.

Default value: None
runconfig_pipeline_params

Een onderdrukking van runconfig-eigenschappen tijdens runtime met behulp van sleutel-waarde koppelt elk met de naam van de runconfig-eigenschap en PipelineParameter voor die eigenschap.

Ondersteunde waarden: 'NodeCount', 'MpiProcessCountPerNode', 'TensorflowWorkerCount', 'TensorflowParameterServerCount'

Default value: None
arguments

Een lijst met opdrachtregelargumenten voor het Python-scriptbestand. De argumenten worden geleverd aan het rekendoel via argumenten in RunConfiguration. Zie de argumenten in RunConfiguration

Default value: None
params

Een woordenlijst met naam-waardeparen.

Default value: None
name
str

De naam van de stap.

Default value: None
_workflow_provider
<xref:azureml.pipeline.core._aeva_provider._AevaWorkflowProvider>

(Alleen intern gebruik.) De werkstroomprovider.

Default value: None
module
Vereist

De module die in de stap wordt gebruikt. Geef de module parameter of op module_version , maar niet beide.

version
Vereist
str

De versie van de module die in de stap wordt gebruikt.

module_version
Vereist

De ModuleVersion van de module die in de stap wordt gebruikt. Geef de module parameter of op module_version , maar niet beide.

inputs_map
Vereist
dict[str, Union[InputPortBinding, DataReference, PortDataReference, PipelineData, <xref:azureml.pipeline.core.pipeline_output_dataset.PipelineOutputDataset>, DatasetConsumptionConfig]]

Een woordenlijst die de namen van poortdefinities van de ModuleVersion toewijst aan de invoer van de stap.

outputs_map
Vereist
dict[str, Union[InputPortBinding, DataReference, PortDataReference, PipelineData, <xref:azureml.pipeline.core.pipeline_output_dataset.PipelineOutputDataset>]]

Een woordenlijst die de namen van poortdefinities van de ModuleVersion toewijst aan de uitvoer van de stap.

compute_target
Vereist

Het rekendoel dat moet worden gebruikt. Als dit niet is opgegeven, wordt het doel van de runconfig gebruikt. Dit kan een rekendoelobject zijn of de tekenreeksnaam van een rekendoel in de werkruimte. Als het rekendoel niet beschikbaar is tijdens het maken van de pijplijn, kunt u desgewenst een tuple van opgeven ('naam rekendoel', 'type rekendoel') om te voorkomen dat het rekendoelobject wordt opgehaald (AmlCompute-type is 'AmlCompute' en het type RemoteCompute is 'VirtualMachine').

runconfig
Vereist

Een optionele RunConfiguration die moet worden gebruikt. Een RunConfiguration kan worden gebruikt om aanvullende vereisten voor de uitvoering op te geven, zoals conda-afhankelijkheden en een Docker-installatiekopieën.

runconfig_pipeline_params
Vereist

Een onderdrukking van runconfig-eigenschappen tijdens runtime met behulp van sleutel-waarde koppelt elk met de naam van de runconfig-eigenschap en PipelineParameter voor die eigenschap.

Ondersteunde waarden: 'NodeCount', 'MpiProcessCountPerNode', 'TensorflowWorkerCount', 'TensorflowParameterServerCount'

arguments
Vereist

Een lijst met opdrachtregelargumenten voor het Python-scriptbestand. De argumenten worden geleverd aan het rekendoel via argumenten in RunConfiguration. Zie de argumenten in RunConfiguration

params
Vereist

Een woordenlijst met naam-waardeparen.

name
Vereist
str

De naam van de stap.

_wokflow_provider
Vereist

(Alleen intern gebruik.) De werkstroomprovider.

Opmerkingen

Een Module wordt gebruikt voor het maken en beheren van een herbruikbare rekenkundige eenheid van een Azure Machine Learning-pijplijn. ModuleStap is de ingebouwde stap in Azure Machine Learning die wordt gebruikt om een module te gebruiken. U kunt specifiek definiëren welke ModuleVersion moet worden gebruikt of Azure Machine Learning laten oplossen welke ModuleVersion moet worden gebruikt volgens het oplossingsproces dat is gedefinieerd in de sectie Opmerkingen van de Module klasse. Als u wilt definiëren welke ModuleVersion wordt gebruikt in een verzonden pijplijn, definieert u een van de volgende bij het maken van een ModuleStap:

  • Een ModuleVersion object.

  • Een Module object en een versiewaarde.

  • Een Module object zonder versiewaarde. In dit geval kan de versieomzetting per inzending verschillen.

U moet de toewijzing definiëren tussen de in- en uitvoer van de ModuleStep aan de invoer en uitvoer van de ModuleVersion.

In het volgende voorbeeld ziet u hoe u een ModuleStap maakt als onderdeel van de pijplijn met meerdere ModuleStap-objecten:


   middle_step = ModuleStep(module=module,
                            inputs_map= middle_step_input_wiring,
                            outputs_map= middle_step_output_wiring,
                            runconfig=RunConfiguration(), compute_target=aml_compute,
                            arguments = ["--file_num1", first_sum, "--file_num2", first_prod,
                                         "--output_sum", middle_sum, "--output_product", middle_prod])

Volledig voorbeeld is beschikbaar via https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-how-to-use-modulestep.ipynb

Methoden

create_node

Maak een knooppunt uit de moduleStapstap en voeg dit toe aan de opgegeven grafiek.

Deze methode is niet bedoeld om rechtstreeks te worden gebruikt. Wanneer een pijplijn wordt geïnstantieerd met deze stap, geeft Azure ML automatisch de vereiste parameters door via deze methode, zodat deze stap kan worden toegevoegd aan een pijplijngrafiek die de werkstroom vertegenwoordigt.

create_node

Maak een knooppunt uit de moduleStapstap en voeg dit toe aan de opgegeven grafiek.

Deze methode is niet bedoeld om rechtstreeks te worden gebruikt. Wanneer een pijplijn wordt geïnstantieerd met deze stap, geeft Azure ML automatisch de vereiste parameters door via deze methode, zodat deze stap kan worden toegevoegd aan een pijplijngrafiek die de werkstroom vertegenwoordigt.

create_node(graph, default_datastore, context)

Parameters

Name Description
graph
Vereist

Het grafiekobject waaraan u het knooppunt wilt toevoegen.

default_datastore
Vereist

Het standaardgegevensarchief.

context
Vereist
<xref:azureml.pipeline.core._GraphContext>

De grafiekcontext.

Retouren

Type Description

Het knooppuntobject.