Module Klas

Vertegenwoordigt een rekeneenheid die wordt gebruikt in een Azure Machine Learning-pijplijn.

Een module is een verzameling bestanden die wordt uitgevoerd op een rekendoel en een beschrijving van een interface. De verzameling bestanden kan script, binaire bestanden of andere bestanden zijn die nodig zijn om uit te voeren op het rekendoel. De module-interface beschrijft invoer, uitvoer en parameterdefinities. Ze worden niet gebonden aan specifieke waarden of gegevens. Aan een module is een momentopname gekoppeld, die de verzameling bestanden vastlegt die voor de module zijn gedefinieerd.

Module initialiseren.

Overname
builtins.object
Module

Constructor

Module(workspace, module_id, name, description, status, default_version, module_version_list, _module_provider=None, _module_version_provider=None)

Parameters

workspace
Workspace
Vereist

Het werkruimteobject waartoe deze module behoort.

module_id
str
Vereist

De id van de module.

name
str
Vereist

De naam van de module.

description
str
Vereist

De beschrijving van de module.

status
str
Vereist

De nieuwe status van de module: 'Actief', 'Afgeschaft' of 'Uitgeschakeld'.

default_version
str
Vereist

De standaardversie van de module.

module_version_list
list
Vereist

Een lijst met ModuleVersionDescriptor objecten.

_module_provider
<xref:azureml.pipeline.core._aeva_provider._AzureMLModuleProvider>
standaardwaarde: None

(Alleen intern gebruik.) De moduleprovider.

_module_version_provider
<xref:azureml.pipeline.core._aeva_provider._AevaMlModuleVersionProvider>
standaardwaarde: None

(Alleen intern gebruik.) De ModuleVersion-provider.

workspace
Workspace
Vereist

Het werkruimteobject waartoe deze module behoort.

module_id
str
Vereist

De id van de module.

name
str
Vereist

De naam van de module.

description
str
Vereist

De beschrijving van de module.

status
str
Vereist

De nieuwe status van de module: 'Actief', 'Afgeschaft' of 'Uitgeschakeld'.

default_version
str
Vereist

De standaardversie van de module.

module_version_list
list
Vereist

Een lijst met ModuleVersionDescriptor objecten.

_module_provider
<xref:<xref:_AevaMlModuleProvider object>>
Vereist

De moduleprovider.

_module_version_provider
<xref:azureml.pipeline.core._aeva_provider._AevaMlModuleVersionProvider>
Vereist

De ModuleVersion-provider.

Opmerkingen

Een module fungeert als een container van de bijbehorende versies. In het volgende voorbeeld wordt een ModuleVersion gemaakt op basis van de publish_python_script methode en heeft deze twee invoer- en twee uitvoerwaarden. ModuleVersion maken is de standaardversie (is_default is ingesteld op True).


   out_sum = OutputPortDef(name="out_sum", default_datastore_name=datastore.name, default_datastore_mode="mount",
                           label="Sum of two numbers")
   out_prod = OutputPortDef(name="out_prod", default_datastore_name=datastore.name, default_datastore_mode="mount",
                            label="Product of two numbers")
   entry_version = module.publish_python_script("calculate.py", "initial",
                                                inputs=[], outputs=[out_sum, out_prod], params = {"initialNum":12},
                                                version="1", source_directory="./calc")

Het volledige voorbeeld is beschikbaar via https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-how-to-use-modulestep.ipynb

Deze module kan worden gebruikt bij het definiëren van een pijplijn, in verschillende stappen, met behulp van een ModuleStep.

In het volgende voorbeeld ziet u hoe u de gegevens die in de pijplijn worden gebruikt, kunt koppelen aan in- en uitvoer van een ModuleVersion met behulp van PipelineData:


   middle_step_input_wiring = {"in1":first_sum, "in2":first_prod}
   middle_sum = PipelineData("middle_sum", datastore=datastore, output_mode="mount",is_directory=False)
   middle_prod = PipelineData("middle_prod", datastore=datastore, output_mode="mount",is_directory=False)
   middle_step_output_wiring = {"out_sum":middle_sum, "out_prod":middle_prod}

Het volledige voorbeeld is beschikbaar via https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-how-to-use-modulestep.ipynb

De toewijzing kan vervolgens worden gebruikt bij het maken van de moduleStap:


   middle_step = ModuleStep(module=module,
                            inputs_map= middle_step_input_wiring,
                            outputs_map= middle_step_output_wiring,
                            runconfig=RunConfiguration(), compute_target=aml_compute,
                            arguments = ["--file_num1", first_sum, "--file_num2", first_prod,
                                         "--output_sum", middle_sum, "--output_product", middle_prod])

Het volledige voorbeeld is beschikbaar via https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-how-to-use-modulestep.ipynb

De oplossing van welke versie van de module moet worden gebruikt, vindt plaats bij het indienen en volgt het volgende proces:

  • Alle uitgeschakelde versies verwijderen
  • Als er een specifieke versie is vermeld, gebruikt u die, anders
  • Als er een standaardversie is gedefinieerd voor de module, gebruikt u die, anders
  • Als alle versies semantisch versiebeheer zonder letters volgen, neemt u de hoogste waarde, anders
  • Neem de versie van de module die het laatst is bijgewerkt

Houd er rekening mee dat, omdat de toewijzing van de invoer en uitvoer van een knooppunt aan de invoer en uitvoer van een module wordt gedefinieerd bij het maken van de pijplijn, als de opgeloste versie bij het indienen een andere interface heeft dan de interface die wordt opgelost bij het maken van de pijplijn, mislukt het verzenden van de pijplijn.

De onderliggende module kan worden bijgewerkt met nieuwe versies terwijl de standaardversie hetzelfde blijft.

Modules hebben een unieke naam binnen een werkruimte.

Methoden

create

Maak de module.

deprecate

Stel de module in op Afgeschaft.

disable

Stel de module in op Uitgeschakeld.

enable

Stel de module in op 'Actief'.

get

Haal de module op op naam of id; genereert een uitzondering als een van beide niet is opgegeven.

get_default

Haal de standaardmoduleversie op.

get_default_version

Haal de standaardversie van Module op.

get_versions

Haal alle versies van de module op.

module_def_builder

Maak het moduledefinitieobject dat de stap beschrijft.

module_version_list

Haal de lijst met moduleversies op.

process_source_directory

Verwerk de bronmap voor de stap en controleer of het script bestaat.

publish

Maak een ModuleVersion en voeg deze toe aan de huidige module.

publish_adla_script

Maak een ModuleVersion op basis van Azure Data Lake Analytics (ADLA) en voeg deze toe aan de huidige module.

publish_azure_batch

Maak een ModuleVersion die gebruikmaakt van Azure-batch en voeg deze toe aan de huidige module.

publish_python_script

Maak een ModuleVersion op basis van een Python-script en voeg deze toe aan de huidige module.

resolve

Los het probleem op en retourneer de juiste ModuleVersion.

set_default_version

Stel de standaardModuleVersion van de module in.

set_description

Stel de beschrijving van module in.

set_name

Stel de naam van module in.

create

Maak de module.

static create(workspace, name, description, _workflow_provider=None)

Parameters

workspace
Workspace
Vereist

De werkruimte waarin de module moet worden gemaakt.

name
str
Vereist

De naam van de module.

description
str
Vereist

De beschrijving van de module.

_workflow_provider
<xref:azureml.pipeline.core._aeva_provider._AevaWorkflowProvider>
standaardwaarde: None

(Alleen intern gebruik.) De werkstroomprovider.

Retouren

Moduleobject

Retourtype

deprecate

Stel de module in op Afgeschaft.

deprecate()

disable

Stel de module in op Uitgeschakeld.

disable()

enable

Stel de module in op 'Actief'.

enable()

get

Haal de module op op naam of id; genereert een uitzondering als een van beide niet is opgegeven.

static get(workspace, module_id=None, name=None, _workflow_provider=None)

Parameters

workspace
Workspace
Vereist

De werkruimte waarin de module moet worden gemaakt.

module_id
str
standaardwaarde: None

De id van de module.

name
str
standaardwaarde: None

De naam van de module.

_workflow_provider
<xref:azureml.pipeline.core._aeva_provider._AevaWorkflowProvider>
standaardwaarde: None

(Alleen intern gebruik.) De werkstroomprovider.

Retouren

Moduleobject

Retourtype

get_default

Haal de standaardmoduleversie op.

get_default()

Retouren

De standaardmoduleversie.

Retourtype

get_default_version

Haal de standaardversie van Module op.

get_default_version()

Retouren

De standaardversie van de module.

Retourtype

str

get_versions

Haal alle versies van de module op.

static get_versions(workspace, name, _workflow_provider=None)

Parameters

workspace
Workspace
Vereist

De werkruimte waarop de module is gemaakt.

name
str
Vereist

De naam van de module.

_workflow_provider
<xref:azureml.pipeline.core._aeva_provider._AevaWorkflowProvider>
standaardwaarde: None

(Alleen intern gebruik.) De werkstroomprovider.

Retouren

De lijst met ModuleVersionDescriptor

Retourtype

module_def_builder

Maak het moduledefinitieobject dat de stap beschrijft.

static module_def_builder(name, description, execution_type, input_bindings, output_bindings, param_defs=None, create_sequencing_ports=True, allow_reuse=True, version=None, module_type=None, step_type=None, arguments=None, runconfig=None, cloud_settings=None)

Parameters

name
str
Vereist

De naam van de module.

description
str
Vereist

De beschrijving van de module.

execution_type
str
Vereist

Het uitvoeringstype van de module.

input_bindings
list
Vereist

De module-invoerbindingen.

output_bindings
list
Vereist

De module-uitvoerbindingen.

param_defs
list
standaardwaarde: None

De moduleparameterdefinities.

create_sequencing_ports
bool
standaardwaarde: True

Hiermee wordt aangegeven of er sequentiërende poorten worden gemaakt voor de module.

allow_reuse
bool
standaardwaarde: True

Hiermee wordt aangegeven of de module beschikbaar is voor hergebruik.

version
str
standaardwaarde: None

De versie van de module.

module_type
str
standaardwaarde: None

Het moduletype.

step_type
str
standaardwaarde: None

Type stap dat aan deze module is gekoppeld, bijvoorbeeld 'PythonScriptStep', 'HyperDriveStep', enzovoort.

arguments
list
standaardwaarde: None

Lijst met argumenten met aantekeningen die moeten worden gebruikt bij het aanroepen van deze module

runconfig
str
standaardwaarde: None

Runconfig die wordt gebruikt voor python_script_step

cloud_settings
str
standaardwaarde: None

Instellingen die worden gebruikt voor clouds

Retouren

Het object Module def.

Retourtype

Uitzonderingen

module_version_list

Haal de lijst met moduleversies op.

module_version_list()

Retouren

De lijst met ModuleVersionDescriptor

Retourtype

process_source_directory

Verwerk de bronmap voor de stap en controleer of het script bestaat.

static process_source_directory(name, source_directory, script_name)

Parameters

name
str
Vereist

De naam van de stap.

source_directory
str
Vereist

De bronmap voor de stap.

script_name
str
Vereist

De scriptnaam voor de stap.

Retouren

De bronmap en hashpaden.

Retourtype

Uitzonderingen

publish

Maak een ModuleVersion en voeg deze toe aan de huidige module.

publish(description, execution_type, inputs, outputs, param_defs=None, create_sequencing_ports=True, version=None, is_default=False, content_path=None, hash_paths=None, category=None, arguments=None, runconfig=None)

Parameters

description
str
Vereist

De beschrijving van de module.

execution_type
str
Vereist

Het uitvoeringstype van de module. Acceptabele waarden zijn esCloud, adlcloud en AzureBatchCloud

inputs
list
Vereist

De module-invoer.

outputs
list
Vereist

De module-uitvoer.

param_defs
list
standaardwaarde: None

De parameterdefinities van de module.

create_sequencing_ports
bool
standaardwaarde: True

Hiermee wordt aangegeven of er sequentiërende poorten worden gemaakt voor de module.

version
str
standaardwaarde: None

De versie van de module.

is_default
bool
standaardwaarde: False

Hiermee wordt aangegeven of de gepubliceerde versie de standaardversie moet zijn.

content_path
str
standaardwaarde: None

map

hash_paths
list
standaardwaarde: None

Een lijst met paden naar hash bij het controleren op wijzigingen in de inhoud van de stap. Als er geen wijzigingen zijn gedetecteerd, wordt de inhoud van de stap uit een vorige uitvoering opnieuw gebruikt. Standaard wordt de inhoud van de source_directory gehasht (met uitzondering van bestanden die worden vermeld in .amlignore of .gitignore). AFGESCHAFT: niet meer nodig.

category
str
standaardwaarde: None

De categorie van de moduleversie

arguments
list
standaardwaarde: None

Argumenten die moeten worden gebruikt bij het aanroepen van de module. Argumenten kunnen tekenreeksen, invoerverwijzingen (InputPortDef), uitvoerverwijzingen (OutputPortDef) en pijplijnparameters (PipelineParameter) zijn.

runconfig
RunConfiguration
standaardwaarde: None

Een optionele RunConfiguration. Een RunConfiguration kan worden gebruikt om aanvullende vereisten voor de uitvoering op te geven, zoals conda-afhankelijkheden en een Docker-installatiekopieën.

Retourtype

Uitzonderingen

publish_adla_script

Maak een ModuleVersion op basis van Azure Data Lake Analytics (ADLA) en voeg deze toe aan de huidige module.

publish_adla_script(script_name, description, inputs, outputs, params=None, create_sequencing_ports=True, degree_of_parallelism=None, priority=None, runtime_version=None, compute_target=None, version=None, is_default=False, source_directory=None, hash_paths=None, category=None, arguments=None)

Parameters

script_name
str
Vereist

De naam van een ADLA-script, ten opzichte source_directoryvan .

description
str
Vereist

De beschrijving van de moduleversie.

inputs
list
Vereist

De module-invoerbindingen.

outputs
list
Vereist

De module-uitvoerbindingen.

params
dict
standaardwaarde: None

De ModuleVersion-parameters, als naam-default_value paren.

create_sequencing_ports
bool
standaardwaarde: True

Hiermee wordt aangegeven of er sequentiërende poorten worden gemaakt voor de module.

degree_of_parallelism
int
standaardwaarde: None

De mate van parallelle uitvoering die voor deze taak moet worden gebruikt.

priority
int
standaardwaarde: None

De prioriteitswaarde die moet worden gebruikt voor de huidige taak.

runtime_version
str
standaardwaarde: None

De runtimeversie van de ADLA-engine (Azure Data Lake Analytics).

compute_target
AdlaCompute, str
standaardwaarde: None

De ADLA-berekening die voor deze taak moet worden gebruikt.

version
str
standaardwaarde: None

De versie van de module.

is_default
bool
standaardwaarde: False

Hiermee wordt aangegeven of de gepubliceerde versie de standaardversie moet zijn.

source_directory
str
standaardwaarde: None

map

hash_paths
list
standaardwaarde: None

hash_paths

category
str
standaardwaarde: None

De categorie van de moduleversie

arguments
list
standaardwaarde: None

Argumenten die moeten worden gebruikt bij het aanroepen van de module. Argumenten kunnen tekenreeksen, invoerverwijzingen (InputPortDef), uitvoerverwijzingen (OutputPortDef) en pijplijnparameters (PipelineParameter) zijn.

Retourtype

publish_azure_batch

Maak een ModuleVersion die gebruikmaakt van Azure-batch en voeg deze toe aan de huidige module.

publish_azure_batch(description, compute_target, inputs, outputs, params=None, create_sequencing_ports=True, version=None, is_default=False, create_pool=False, pool_id=None, delete_batch_job_after_finish=False, delete_batch_pool_after_finish=False, is_positive_exit_code_failure=True, vm_image_urn='urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter', run_task_as_admin=False, target_compute_nodes=1, vm_size='standard_d1_v2', executable=None, source_directory=None, category=None, arguments=None)

Parameters

description
str
Vereist

De beschrijving van de moduleversie.

compute_target
BatchCompute of str
Vereist

Het BatchCompute-rekendoel.

inputs
list
Vereist

De module-invoerbindingen.

outputs
list
Vereist

De module-uitvoerbindingen.

params
dict
standaardwaarde: None

De ModuleVersion-parameters, als naam-default_value paren.

create_sequencing_ports
bool
standaardwaarde: True

Hiermee wordt aangegeven of er sequentiërende poorten worden gemaakt voor de module.

version
str
standaardwaarde: None

De versie van de module.

is_default
bool
standaardwaarde: False

Hiermee wordt aangegeven of de gepubliceerde versie de standaardversie moet zijn.

create_pool
bool
standaardwaarde: False

Hiermee wordt aangegeven of de pool moet worden gemaakt voordat de taken worden uitgevoerd.

pool_id
str
standaardwaarde: None

(Verplicht) De id van de pool waarin de taak wordt uitgevoerd.

delete_batch_job_after_finish
bool
standaardwaarde: False

Hiermee wordt aangegeven of de taak uit het Batch-account moet worden verwijderd nadat deze is voltooid.

delete_batch_pool_after_finish
bool
standaardwaarde: False

Geeft aan of de pool moet worden verwijderd nadat de taak is voltooid.

is_positive_exit_code_failure
bool
standaardwaarde: True

Geeft aan of de taak mislukt als de taak bestaat met een positieve code.

vm_image_urn
str
standaardwaarde: urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter

Als create_pool True is en de VM VirtualMachineConfiguration gebruikt, geeft deze parameter de VM-installatiekopieën aan die moeten worden gebruikt. Waardenotatie: urn:publisher:offer:sku. Bijvoorbeeld: urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter.

run_task_as_admin
bool
standaardwaarde: False

Hiermee wordt aangegeven of de taak moet worden uitgevoerd met Beheer bevoegdheden.

target_compute_nodes
int
standaardwaarde: 1

Als create_pool waar is, wordt aangegeven hoeveel rekenknooppunten aan de pool worden toegevoegd.

vm_size
str
standaardwaarde: standard_d1_v2

Als create_pool waar is, wordt de grootte van de virtuele machine van de rekenknooppunten aangegeven.

executable
str
standaardwaarde: None

De naam van de opdracht/het uitvoerbare bestand dat wordt uitgevoerd als onderdeel van de taak.

source_directory
str
standaardwaarde: None

De bronmap.

category
str
standaardwaarde: None

De categorie van de moduleversie

arguments
list
standaardwaarde: None

Argumenten die moeten worden gebruikt bij het aanroepen van de module. Argumenten kunnen tekenreeksen, invoerverwijzingen (InputPortDef), uitvoerverwijzingen (OutputPortDef) en pijplijnparameters (PipelineParameter) zijn.

Retourtype

Uitzonderingen

publish_python_script

Maak een ModuleVersion op basis van een Python-script en voeg deze toe aan de huidige module.

publish_python_script(script_name, description, inputs, outputs, params=None, create_sequencing_ports=True, version=None, is_default=False, source_directory=None, hash_paths=None, category=None, arguments=None, runconfig=None)

Parameters

script_name
str
Vereist

De naam van een Python-script, ten opzichte source_directoryvan .

description
str
Vereist

De beschrijving van de moduleversie.

inputs
list
Vereist

De module-invoerbindingen.

outputs
list
Vereist

De module-uitvoerbindingen.

params
dict
standaardwaarde: None

De ModuleVersion-parameters, als naam-default_value paren.

create_sequencing_ports
bool
standaardwaarde: True

Hiermee wordt aangegeven of er sequentiërende poorten worden gemaakt voor de module.

version
str
standaardwaarde: None

De versie van de module.

is_default
bool
standaardwaarde: False

Hiermee wordt aangegeven of de gepubliceerde versie de standaardversie moet zijn.

source_directory
str
standaardwaarde: None

map

hash_paths
list
standaardwaarde: None

Een lijst met paden naar hash bij het controleren op wijzigingen in de inhoud van de stap. Als er geen wijzigingen zijn gedetecteerd, wordt de inhoud van de stap uit een vorige uitvoering opnieuw gebruikt. De inhoud van de source_directory wordt standaard gehasht (met uitzondering van bestanden die worden vermeld in .amlignore of .gitignore). AFGESCHAFT: niet meer nodig.

category
str
standaardwaarde: None

De categorie van de moduleversie

arguments
list
standaardwaarde: None

Argumenten die moeten worden gebruikt bij het aanroepen van de module. Argumenten kunnen tekenreeksen, invoerverwijzingen (InputPortDef), uitvoerverwijzingen (OutputPortDef) en pijplijnparameters (PipelineParameter) zijn.

runconfig
RunConfiguration
standaardwaarde: None

Een optionele RunConfiguration. Een RunConfiguration kan worden gebruikt om aanvullende vereisten voor de uitvoering op te geven, zoals conda-afhankelijkheden en een Docker-installatiekopieën.

Retourtype

resolve

Los het probleem op en retourneer de juiste ModuleVersion.

resolve(version=None)

Parameters

version
standaardwaarde: None

Retouren

De moduleversie die moet worden gebruikt.

Retourtype

set_default_version

Stel de standaardModuleVersion van de module in.

set_default_version(version_id)

Parameters

version_id
Vereist

Retouren

De standaardversie.

Retourtype

str

Uitzonderingen

set_description

Stel de beschrijving van module in.

set_description(description)

Parameters

description
str
Vereist

De beschrijving die moet worden ingesteld.

Uitzonderingen

set_name

Stel de naam van module in.

set_name(name)

Parameters

name
str
Vereist

De naam die moet worden ingesteld.

Uitzonderingen

Kenmerken

default_version

Haal de standaardversie van de module op.

Retouren

De standaardversietekenreeks.

Retourtype

str

description

Haal de beschrijving van de module op.

Retouren

De beschrijvingstekenreeks.

Retourtype

str

id

Haal de id van de module op.

Retouren

De id.

Retourtype

str

name

Haal de naam van de module op.

Retouren

De naam.

Retourtype

str

status

Haal de status van de module op.

Retouren

De status.

Retourtype

str