Module Klas
Vertegenwoordigt een rekeneenheid die wordt gebruikt in een Azure Machine Learning-pijplijn.
Een module is een verzameling bestanden die worden uitgevoerd op een rekendoel en een beschrijving van een interface. De verzameling bestanden kan scripts, binaire bestanden of andere bestanden zijn die nodig zijn om uit te voeren op het rekendoel. In de module-interface worden invoer-, uitvoer- en parameterdefinities beschreven. Ze worden niet gekoppeld aan specifieke waarden of gegevens. Aan een module is een momentopname gekoppeld, waarmee de verzameling bestanden wordt vastgelegd die zijn gedefinieerd voor de module.
Initialiseer module.
Constructor
Module(workspace, module_id, name, description, status, default_version, module_version_list, _module_provider=None, _module_version_provider=None)
Parameters
Name | Description |
---|---|
workspace
Vereist
|
Het werkruimteobject waartoe deze module behoort. |
module_id
Vereist
|
De id van de module. |
name
Vereist
|
De naam van de module. |
description
Vereist
|
De beschrijving van de module. |
status
Vereist
|
De nieuwe status van de module: 'Actief', 'Afgeschaft' of 'Uitgeschakeld'. |
default_version
Vereist
|
De standaardversie van de module. |
module_version_list
Vereist
|
Een lijst ModuleVersionDescriptor met objecten. |
_module_provider
|
<xref:azureml.pipeline.core._aeva_provider._AzureMLModuleProvider>
(Alleen intern gebruik.) De moduleprovider. Default value: None
|
_module_version_provider
|
<xref:azureml.pipeline.core._aeva_provider._AevaMlModuleVersionProvider>
(Alleen intern gebruik.) De ModuleVersion-provider. Default value: None
|
workspace
Vereist
|
Het werkruimteobject waartoe deze module behoort. |
module_id
Vereist
|
De id van de module. |
name
Vereist
|
De naam van de module. |
description
Vereist
|
De beschrijving van de module. |
status
Vereist
|
De nieuwe status van de module: 'Actief', 'Afgeschaft' of 'Uitgeschakeld'. |
default_version
Vereist
|
De standaardversie van de module. |
module_version_list
Vereist
|
Een lijst ModuleVersionDescriptor met objecten. |
_module_provider
Vereist
|
<xref:<xref:_AevaMlModuleProvider object>>
De moduleprovider. |
_module_version_provider
Vereist
|
<xref:azureml.pipeline.core._aeva_provider._AevaMlModuleVersionProvider>
De ModuleVersion-provider. |
Opmerkingen
Een module fungeert als een container van de versies. In het volgende voorbeeld wordt een ModuleVersion gemaakt op basis van de publish_python_script methode en heeft twee invoer en twee uitvoerwaarden. ModuleVersion maken is de standaardversie (is_default
is ingesteld op True).
out_sum = OutputPortDef(name="out_sum", default_datastore_name=datastore.name, default_datastore_mode="mount",
label="Sum of two numbers")
out_prod = OutputPortDef(name="out_prod", default_datastore_name=datastore.name, default_datastore_mode="mount",
label="Product of two numbers")
entry_version = module.publish_python_script("calculate.py", "initial",
inputs=[], outputs=[out_sum, out_prod], params = {"initialNum":12},
version="1", source_directory="./calc")
Volledig voorbeeld is beschikbaar vanaf https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-how-to-use-modulestep.ipynb
Deze module kan worden gebruikt bij het definiëren van een pijplijn, in verschillende stappen, met behulp van een ModuleStep.
In het volgende voorbeeld ziet u hoe u de gegevens die in de pijplijn worden gebruikt, kunt koppelen aan invoer en uitvoer van een ModuleVersion met behulp PipelineDatavan:
middle_step_input_wiring = {"in1":first_sum, "in2":first_prod}
middle_sum = PipelineData("middle_sum", datastore=datastore, output_mode="mount",is_directory=False)
middle_prod = PipelineData("middle_prod", datastore=datastore, output_mode="mount",is_directory=False)
middle_step_output_wiring = {"out_sum":middle_sum, "out_prod":middle_prod}
Volledig voorbeeld is beschikbaar vanaf https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-how-to-use-modulestep.ipynb
De toewijzing kan vervolgens worden gebruikt bij het maken van de ModuleStep:
middle_step = ModuleStep(module=module,
inputs_map= middle_step_input_wiring,
outputs_map= middle_step_output_wiring,
runconfig=RunConfiguration(), compute_target=aml_compute,
arguments = ["--file_num1", first_sum, "--file_num2", first_prod,
"--output_sum", middle_sum, "--output_product", middle_prod])
Volledig voorbeeld is beschikbaar vanaf https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-how-to-use-modulestep.ipynb
De oplossing van welke versie van de module moet worden gebruikt bij het indienen en volgt het volgende proces:
- Alle uitgeschakelde versies verwijderen
- Als er een specifieke versie is opgegeven, gebruikt u die, anders
- Als er een standaardversie is gedefinieerd voor de module, gebruikt u die, anders
- Als alle versies semantische versiebeheer zonder letters volgen, neemt u de hoogste waarde, anders
- Neem de versie van de module die het laatst is bijgewerkt
Houd er rekening mee dat omdat de invoer- en uitvoertoewijzingen van een knooppunt aan de invoer en uitvoer van een module zijn gedefinieerd bij het maken van de pijplijn, als de opgeloste versie bij verzending een andere interface heeft dan de interface die is opgelost bij het maken van de pijplijn, mislukt de verzending van de pijplijn.
De onderliggende module kan worden bijgewerkt met nieuwe versies, terwijl de standaardversie hetzelfde blijft.
Modules hebben een unieke naam binnen een werkruimte.
Methoden
create |
Maak de module. |
deprecate |
Stel de module in op Afgeschaft. |
disable |
Stel de module in op Uitgeschakeld. |
enable |
Stel de module in op Actief. |
get |
Haal de module op naam of op id op; genereert een uitzondering als er geen van beide is opgegeven. |
get_default |
Haal de standaardmoduleversie op. |
get_default_version |
Haal de standaardversie van Module op. |
get_versions |
Haal alle versies van de module op. |
module_def_builder |
Maak het moduledefinitieobject dat de stap beschrijft. |
module_version_list |
Haal de lijst met moduleversies op. |
process_source_directory |
Procesbronmap voor de stap en controleer of het script bestaat. |
publish |
Maak een ModuleVersion en voeg deze toe aan de huidige module. |
publish_adla_script |
Maak een ModuleVersion op basis van Azure Data Lake Analytics (ADLA) en voeg deze toe aan de huidige module. |
publish_azure_batch |
Maak een ModuleVersion die gebruikmaakt van Azure Batch en voeg deze toe aan de huidige module. |
publish_python_script |
Maak een ModuleVersion die is gebaseerd op een Python-script en voeg dit toe aan de huidige module. |
resolve |
Los de juiste ModuleVersion op en retourneer deze. |
set_default_version |
Stel de standaard ModuleVersion van de module in. |
set_description |
Stel de beschrijving van module in. |
set_name |
Stel de naam van module in. |
create
Maak de module.
static create(workspace, name, description, _workflow_provider=None)
Parameters
Name | Description |
---|---|
workspace
Vereist
|
De werkruimte waarin de module moet worden gemaakt. |
name
Vereist
|
De naam van de module. |
description
Vereist
|
De beschrijving van de module. |
_workflow_provider
|
<xref:azureml.pipeline.core._aeva_provider._AevaWorkflowProvider>
(Alleen intern gebruik.) De werkstroomprovider. Default value: None
|
Retouren
Type | Description |
---|---|
Moduleobject |
deprecate
Stel de module in op Afgeschaft.
deprecate()
disable
Stel de module in op Uitgeschakeld.
disable()
enable
Stel de module in op Actief.
enable()
get
Haal de module op naam of op id op; genereert een uitzondering als er geen van beide is opgegeven.
static get(workspace, module_id=None, name=None, _workflow_provider=None)
Parameters
Name | Description |
---|---|
workspace
Vereist
|
De werkruimte waarin de module moet worden gemaakt. |
module_id
|
De id van de module. Default value: None
|
name
|
De naam van de module. Default value: None
|
_workflow_provider
|
<xref:azureml.pipeline.core._aeva_provider._AevaWorkflowProvider>
(Alleen intern gebruik.) De werkstroomprovider. Default value: None
|
Retouren
Type | Description |
---|---|
Moduleobject |
get_default
Haal de standaardmoduleversie op.
get_default()
Retouren
Type | Description |
---|---|
De standaardmoduleversie. |
get_default_version
Haal de standaardversie van Module op.
get_default_version()
Retouren
Type | Description |
---|---|
De standaardversie van de module. |
get_versions
Haal alle versies van de module op.
static get_versions(workspace, name, _workflow_provider=None)
Parameters
Name | Description |
---|---|
workspace
Vereist
|
De werkruimte waarop de module is gemaakt. |
name
Vereist
|
De naam van de module. |
_workflow_provider
|
<xref:azureml.pipeline.core._aeva_provider._AevaWorkflowProvider>
(Alleen intern gebruik.) De werkstroomprovider. Default value: None
|
Retouren
Type | Description |
---|---|
De lijst met ModuleVersionDescriptor |
module_def_builder
Maak het moduledefinitieobject dat de stap beschrijft.
static module_def_builder(name, description, execution_type, input_bindings, output_bindings, param_defs=None, create_sequencing_ports=True, allow_reuse=True, version=None, module_type=None, step_type=None, arguments=None, runconfig=None, cloud_settings=None)
Parameters
Name | Description |
---|---|
name
Vereist
|
De naam van de module. |
description
Vereist
|
De beschrijving van de module. |
execution_type
Vereist
|
Het uitvoeringstype van de module. |
input_bindings
Vereist
|
De module-invoerbindingen. |
output_bindings
Vereist
|
De module-uitvoerbindingen. |
param_defs
|
De parameterdefinities van de module. Default value: None
|
create_sequencing_ports
|
Geeft aan of de sequentiërende poorten worden gemaakt voor de module. Default value: True
|
allow_reuse
|
Hiermee wordt aangegeven of de module beschikbaar is om opnieuw te worden gebruikt. Default value: True
|
version
|
De versie van de module. Default value: None
|
module_type
|
Het moduletype. Default value: None
|
step_type
|
Het type stap dat is gekoppeld aan deze module, bijvoorbeeld 'PythonScriptStep', 'HyperDriveStep', enzovoort. Default value: None
|
arguments
|
Lijst met geannoteerde argumenten die moeten worden gebruikt bij het aanroepen van deze module Default value: None
|
runconfig
|
Runconfig die wordt gebruikt voor python_script_step Default value: None
|
cloud_settings
|
Instellingen die worden gebruikt voor clouds Default value: None
|
Retouren
Type | Description |
---|---|
Het object Module def. |
Uitzonderingen
Type | Description |
---|---|
module_version_list
Haal de lijst met moduleversies op.
module_version_list()
Retouren
Type | Description |
---|---|
De lijst met ModuleVersionDescriptor |
process_source_directory
Procesbronmap voor de stap en controleer of het script bestaat.
static process_source_directory(name, source_directory, script_name)
Parameters
Name | Description |
---|---|
name
Vereist
|
De naam van de stap. |
source_directory
Vereist
|
De bronmap voor de stap. |
script_name
Vereist
|
De scriptnaam voor de stap. |
Retouren
Type | Description |
---|---|
De bronmap en hashpaden. |
Uitzonderingen
Type | Description |
---|---|
publish
Maak een ModuleVersion en voeg deze toe aan de huidige module.
publish(description, execution_type, inputs, outputs, param_defs=None, create_sequencing_ports=True, version=None, is_default=False, content_path=None, hash_paths=None, category=None, arguments=None, runconfig=None)
Parameters
Name | Description |
---|---|
description
Vereist
|
De beschrijving van de module. |
execution_type
Vereist
|
Het uitvoeringstype van de module.
Acceptabele waarden zijn |
inputs
Vereist
|
De module-invoer. |
outputs
Vereist
|
De module voert uit. |
param_defs
|
De parameterdefinities van de module. Default value: None
|
create_sequencing_ports
|
Geeft aan of de sequentiërende poorten worden gemaakt voor de module. Default value: True
|
version
|
De versie van de module. Default value: None
|
is_default
|
Geeft aan of de gepubliceerde versie de standaardversie is. Default value: False
|
content_path
|
map Default value: None
|
hash_paths
|
Een lijst met paden naar hash bij het controleren op wijzigingen in de inhoud van de stap. Als er geen wijzigingen zijn gedetecteerd, gebruikt de pijplijn de stapinhoud van een vorige uitvoering opnieuw. Standaard wordt de inhoud van de Default value: None
|
category
|
De categorie van de moduleversie Default value: None
|
arguments
|
Argumenten die moeten worden gebruikt bij het aanroepen van de module. Argumenten kunnen tekenreeksen, invoerverwijzingen (InputPortDef), uitvoerverwijzingen (OutputPortDef) en pijplijnparameters (PipelineParameter) zijn. Default value: None
|
runconfig
|
Een optionele RunConfiguration. Een RunConfiguration kan worden gebruikt om aanvullende vereisten voor de uitvoering op te geven, zoals conda-afhankelijkheden en een Docker-installatiekopieën. Default value: None
|
Retouren
Type | Description |
---|---|
Uitzonderingen
Type | Description |
---|---|
publish_adla_script
Maak een ModuleVersion op basis van Azure Data Lake Analytics (ADLA) en voeg deze toe aan de huidige module.
publish_adla_script(script_name, description, inputs, outputs, params=None, create_sequencing_ports=True, degree_of_parallelism=None, priority=None, runtime_version=None, compute_target=None, version=None, is_default=False, source_directory=None, hash_paths=None, category=None, arguments=None)
Parameters
Name | Description |
---|---|
script_name
Vereist
|
De naam van een ADLA-script ten opzichte |
description
Vereist
|
De beschrijving van de moduleversie. |
inputs
Vereist
|
De module-invoerbindingen. |
outputs
Vereist
|
De module-uitvoerbindingen. |
params
|
De ModuleVersion-parameters, als naam-default_value paren. Default value: None
|
create_sequencing_ports
|
Geeft aan of de sequentiërende poorten worden gemaakt voor de module. Default value: True
|
degree_of_parallelism
|
De mate van parallelle uitvoering die voor deze taak moet worden gebruikt. Default value: None
|
priority
|
De prioriteitswaarde die moet worden gebruikt voor de huidige taak. Default value: None
|
runtime_version
|
De runtimeversie van de Azure Data Lake Analytics-engine (ADLA). Default value: None
|
compute_target
|
Het ADLA-rekenproces dat voor deze taak moet worden gebruikt. Default value: None
|
version
|
De versie van de module. Default value: None
|
is_default
|
Geeft aan of de gepubliceerde versie de standaardversie is. Default value: False
|
source_directory
|
map Default value: None
|
hash_paths
|
hash_paths Default value: None
|
category
|
De categorie van de moduleversie Default value: None
|
arguments
|
Argumenten die moeten worden gebruikt bij het aanroepen van de module. Argumenten kunnen tekenreeksen, invoerverwijzingen (InputPortDef), uitvoerverwijzingen (OutputPortDef) en pijplijnparameters (PipelineParameter) zijn. Default value: None
|
Retouren
Type | Description |
---|---|
publish_azure_batch
Maak een ModuleVersion die gebruikmaakt van Azure Batch en voeg deze toe aan de huidige module.
publish_azure_batch(description, compute_target, inputs, outputs, params=None, create_sequencing_ports=True, version=None, is_default=False, create_pool=False, pool_id=None, delete_batch_job_after_finish=False, delete_batch_pool_after_finish=False, is_positive_exit_code_failure=True, vm_image_urn='urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter', run_task_as_admin=False, target_compute_nodes=1, vm_size='standard_d1_v2', executable=None, source_directory=None, category=None, arguments=None)
Parameters
Name | Description |
---|---|
description
Vereist
|
De beschrijving van de moduleversie. |
compute_target
Vereist
|
BatchCompute of
str
Het Rekendoel BatchCompute. |
inputs
Vereist
|
De module-invoerbindingen. |
outputs
Vereist
|
De module-uitvoerbindingen. |
params
|
De ModuleVersion-parameters, als naam-default_value paren. Default value: None
|
create_sequencing_ports
|
Geeft aan of de sequentiërende poorten worden gemaakt voor de module. Default value: True
|
version
|
De versie van de module. Default value: None
|
is_default
|
Geeft aan of de gepubliceerde versie de standaardversie is. Default value: False
|
create_pool
|
Geeft aan of de pool moet worden gemaakt voordat de taken worden uitgevoerd. Default value: False
|
pool_id
|
(Verplicht) De id van de pool waarop de taak wordt uitgevoerd. Default value: None
|
delete_batch_job_after_finish
|
Geeft aan of de taak uit het Batch-account moet worden verwijderd nadat deze is voltooid. Default value: False
|
delete_batch_pool_after_finish
|
Geeft aan of de pool moet worden verwijderd nadat de taak is voltooid. Default value: False
|
is_positive_exit_code_failure
|
Geeft aan of de taak mislukt als de taak bestaat met een positieve code. Default value: True
|
vm_image_urn
|
Als Default value: urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter
|
run_task_as_admin
|
Hiermee wordt aangegeven of de taak moet worden uitgevoerd met beheerdersbevoegdheden. Default value: False
|
target_compute_nodes
|
Als Default value: 1
|
vm_size
|
Als Default value: standard_d1_v2
|
executable
|
De naam van de opdracht/het uitvoerbare bestand dat wordt uitgevoerd als onderdeel van de taak. Default value: None
|
source_directory
|
De bronmap. Default value: None
|
category
|
De categorie van de moduleversie Default value: None
|
arguments
|
Argumenten die moeten worden gebruikt bij het aanroepen van de module. Argumenten kunnen tekenreeksen, invoerverwijzingen (InputPortDef), uitvoerverwijzingen (OutputPortDef) en pijplijnparameters (PipelineParameter) zijn. Default value: None
|
Retouren
Type | Description |
---|---|
Uitzonderingen
Type | Description |
---|---|
publish_python_script
Maak een ModuleVersion die is gebaseerd op een Python-script en voeg dit toe aan de huidige module.
publish_python_script(script_name, description, inputs, outputs, params=None, create_sequencing_ports=True, version=None, is_default=False, source_directory=None, hash_paths=None, category=None, arguments=None, runconfig=None)
Parameters
Name | Description |
---|---|
script_name
Vereist
|
De naam van een Python-script ten opzichte |
description
Vereist
|
De beschrijving van de moduleversie. |
inputs
Vereist
|
De module-invoerbindingen. |
outputs
Vereist
|
De module-uitvoerbindingen. |
params
|
De ModuleVersion-parameters, als naam-default_value paren. Default value: None
|
create_sequencing_ports
|
Geeft aan of de sequentiërende poorten worden gemaakt voor de module. Default value: True
|
version
|
De versie van de module. Default value: None
|
is_default
|
Geeft aan of de gepubliceerde versie de standaardversie is. Default value: False
|
source_directory
|
map Default value: None
|
hash_paths
|
Een lijst met paden naar hash bij het controleren op wijzigingen in de inhoud van de stap. Als er geen wijzigingen zijn gedetecteerd, gebruikt de pijplijn de stapinhoud van een vorige uitvoering opnieuw. De inhoud van de inhoud Default value: None
|
category
|
De categorie van de moduleversie Default value: None
|
arguments
|
Argumenten die moeten worden gebruikt bij het aanroepen van de module. Argumenten kunnen tekenreeksen, invoerverwijzingen (InputPortDef), uitvoerverwijzingen (OutputPortDef) en pijplijnparameters (PipelineParameter) zijn. Default value: None
|
runconfig
|
Een optionele RunConfiguration. Een RunConfiguration kan worden gebruikt om aanvullende vereisten voor de uitvoering op te geven, zoals conda-afhankelijkheden en een Docker-installatiekopieën. Default value: None
|
Retouren
Type | Description |
---|---|
resolve
Los de juiste ModuleVersion op en retourneer deze.
resolve(version=None)
Parameters
Name | Description |
---|---|
version
|
Default value: None
|
Retouren
Type | Description |
---|---|
De moduleversie die moet worden gebruikt. |
set_default_version
set_description
set_name
Kenmerken
default_version
Haal de standaardversie van de module op.
Retouren
Type | Description |
---|---|
De standaardversietekenreeks. |