Delen via


AzureBatchStep Klas

Hiermee maakt u een Azure ML-pijplijnstap voor het verzenden van taken naar Azure Batch.

Opmerking: deze stap biedt geen ondersteuning voor het uploaden/downloaden van mappen en hun inhoud.

Zie het notebook https://aka.ms/pl-azbatchvoor een voorbeeld van het gebruik van AzureBatchStep.

Maak een Azure ML-pijplijnstap voor het verzenden van taken naar Azure Batch.

Constructor

AzureBatchStep(name, create_pool=False, pool_id=None, delete_batch_job_after_finish=True, delete_batch_pool_after_finish=False, is_positive_exit_code_failure=True, vm_image_urn='urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter', run_task_as_admin=False, target_compute_nodes=1, vm_size='standard_d1_v2', source_directory=None, executable=None, arguments=None, inputs=None, outputs=None, allow_reuse=True, compute_target=None, version=None)

Parameters

Name Description
name
Vereist
str

[Vereist] De naam van de stap.

create_pool

Geeft aan of de pool moet worden gemaakt voordat de taken worden uitgevoerd.

Default value: False
pool_id
str

[Vereist] De id van de pool waar de taak wordt uitgevoerd. De id kan een bestaande pool zijn of een pool die wordt gemaakt wanneer de taak wordt verzonden.

Default value: None
delete_batch_job_after_finish

Geeft aan of de taak uit het Batch-account moet worden verwijderd nadat deze is voltooid.

Default value: True
delete_batch_pool_after_finish

Geeft aan of de pool moet worden verwijderd nadat de taak is voltooid.

Default value: False
is_positive_exit_code_failure

Geeft aan of de taak mislukt als de taak bestaat met een positieve code.

Default value: True
vm_image_urn
str

Als create_pool waar is en vm VirtualMachineConfiguration gebruikt. Waardenotatie: urn:publisher:offer:sku. Voorbeeld: urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter.

Default value: urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter
run_task_as_admin

Hiermee wordt aangegeven of de taak moet worden uitgevoerd met beheerdersbevoegdheden.

Default value: False
target_compute_nodes
int

Als create_pool waar is, geeft u aan hoeveel rekenknooppunten aan de pool worden toegevoegd.

Default value: 1
vm_size
str

Als create_pool waar is, geeft u de grootte van de virtuele machine van de rekenknooppunten aan.

Default value: standard_d1_v2
source_directory
str

Een lokale map die de binaire modulebestanden, uitvoerbare bestanden, assembly's, enzovoort bevat.

Default value: None
executable
str

[Vereist] De naam van de opdracht/het uitvoerbare bestand dat wordt uitgevoerd als onderdeel van de taak.

Default value: None
arguments
str

Argumenten voor de opdracht/het uitvoerbare bestand.

Default value: None
inputs

Een lijst met invoerpoortbindingen. Voordat de taak wordt uitgevoerd, wordt er voor elke invoer een map gemaakt. De bestanden voor elke invoer worden gekopieerd van de opslag naar de respectieve map op het rekenknooppunt. Als de invoernaam bijvoorbeeld invoer1 is en het relatieve pad in de opslag een of ander/relatief/pad/dat/kan/echt/lang/inputfile.txt, dan is het bestandspad op de berekening: ./input1/inputfile.txt. Wanneer de invoernaam langer is dan 32 tekens, wordt deze afgekapt en toegevoegd met een uniek achtervoegsel, zodat de mapnaam kan worden gemaakt op het rekendoel.

Default value: None
outputs

Een lijst met uitvoerpoortbindingen. Net als bij invoer wordt voordat de taak wordt uitgevoerd, wordt er voor elke uitvoer een map gemaakt. De mapnaam is hetzelfde als de uitvoernaam. De veronderstelling is dat de taak de uitvoer in die map plaatst.

Default value: None
allow_reuse

Hiermee wordt aangegeven of de stap vorige resultaten opnieuw moet gebruiken wanneer deze opnieuw wordt uitgevoerd met dezelfde instellingen. Hergebruik is standaard ingeschakeld. Als de inhoud van de stap (scripts/afhankelijkheden) en de invoer en parameters ongewijzigd blijven, wordt de uitvoer van de vorige uitvoering van deze stap opnieuw gebruikt. Wanneer u de stap opnieuw gebruikt, worden de resultaten van de vorige uitvoering onmiddellijk beschikbaar gesteld aan eventuele volgende stappen in plaats van de taak te verzenden om te berekenen. Als u Azure Machine Learning-gegevenssets als invoer gebruikt, wordt hergebruik bepaald door of de definitie van de gegevensset is gewijzigd, niet door of de onderliggende gegevens zijn gewijzigd.

Default value: True
compute_target

[Vereist] Een BatchCompute-berekening waar de taak wordt uitgevoerd.

Default value: None
version
str

Een optionele versietag om een wijziging in functionaliteit voor de module aan te geven.

Default value: None
name
Vereist
str

[Vereist] De naam van de stap.

create_pool
Vereist

Geeft aan of de pool moet worden gemaakt voordat de taken worden uitgevoerd.

pool_id
Vereist
str

[Vereist] De id van de pool waar de taak wordt uitgevoerd. De id kan een bestaande pool zijn of een pool die wordt gemaakt wanneer de taak wordt verzonden.

delete_batch_job_after_finish
Vereist

Geeft aan of de taak uit het Batch-account moet worden verwijderd nadat deze is voltooid.

delete_batch_pool_after_finish
Vereist

Geeft aan of de pool moet worden verwijderd nadat de taak is voltooid.

is_positive_exit_code_failure
Vereist

Geeft aan of de taak mislukt als de taak bestaat met een positieve code.

vm_image_urn
Vereist
str

Als create_pool waar is en vm VirtualMachineConfiguration gebruikt. Waardenotatie: urn:publisher:offer:sku. Voorbeeld: urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter.

run_task_as_admin
Vereist

Hiermee wordt aangegeven of de taak moet worden uitgevoerd met beheerdersbevoegdheden.

target_compute_nodes
Vereist
int

Als create_pool waar is, geeft u aan hoeveel rekenknooppunten aan de pool worden toegevoegd.

vm_size
Vereist
str

Als create_pool waar is, geeft u de grootte van de virtuele machine van de rekenknooppunten aan.

source_directory
Vereist
str

Een lokale map die de binaire modulebestanden, uitvoerbare bestanden, assembly's enzovoort bevat.

executable
Vereist
str

[Vereist] De naam van de opdracht/het uitvoerbare bestand dat wordt uitgevoerd als onderdeel van de taak.

arguments
Vereist

Argumenten voor de opdracht/het uitvoerbare bestand.

inputs
Vereist

Een lijst met invoerpoortbindingen. Voordat de taak wordt uitgevoerd, wordt er voor elke invoer een map gemaakt. De bestanden voor elke invoer worden gekopieerd van de opslag naar de respectieve map op het rekenknooppunt. Als de invoernaam bijvoorbeeld invoer1 is en het relatieve pad in de opslag een of ander/relatief/pad/dat/kan/echt/lang/inputfile.txt, dan is het bestandspad op de berekening: ./input1/inputfile.txt. Als de invoernaam langer is dan 32 tekens, wordt deze afgekapt en toegevoegd met een uniek achtervoegsel, zodat de mapnaam kan worden gemaakt op de berekening.

outputs
Vereist

Een lijst met uitvoerpoortbindingen. Net als bij invoer wordt voordat de taak wordt uitgevoerd, wordt er voor elke uitvoer een map gemaakt. De mapnaam is hetzelfde als de uitvoernaam. De veronderstelling is dat de taak de uitvoer in die map heeft.

allow_reuse
Vereist

Hiermee wordt aangegeven of de stap vorige resultaten opnieuw moet gebruiken wanneer deze opnieuw wordt uitgevoerd met dezelfde instellingen. Hergebruik is standaard ingeschakeld. Als de inhoud van de stap (scripts/afhankelijkheden) en de invoer en parameters ongewijzigd blijven, wordt de uitvoer van de vorige uitvoering van deze stap opnieuw gebruikt. Wanneer u de stap opnieuw gebruikt, worden de resultaten van de vorige uitvoering onmiddellijk beschikbaar gesteld aan eventuele volgende stappen in plaats van de taak te verzenden om te berekenen. Als u Azure Machine Learning-gegevenssets als invoer gebruikt, wordt hergebruik bepaald door of de definitie van de gegevensset is gewijzigd, niet door of de onderliggende gegevens zijn gewijzigd.

compute_target
Vereist

[Vereist] Een BatchCompute-berekening waar de taak wordt uitgevoerd.

version
Vereist
str

Een optionele versietag om een wijziging in functionaliteit voor de module aan te geven.

Opmerkingen

In het volgende voorbeeld ziet u hoe u AzureBatchStep gebruikt in een Azure Machine Learning-pijplijn.


   step = AzureBatchStep(
               name="Azure Batch Job",
               pool_id="MyPoolName", # Replace this with the pool name of your choice
               inputs=[testdata],
               outputs=[outputdata],
               executable="azurebatch.cmd",
               arguments=[testdata, outputdata],
               compute_target=batch_compute,
               source_directory=binaries_folder,
   )

Volledig voorbeeld is beschikbaar vanaf https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-how-to-use-azurebatch-to-run-a-windows-executable.ipynb

Methoden

create_node

Maak een knooppunt uit de AzureBatch-stap en voeg dit toe aan de opgegeven grafiek.

Deze methode is niet bedoeld om rechtstreeks te worden gebruikt. Wanneer een pijplijn met deze stap wordt geïnstantieerd, worden in Azure ML automatisch de parameters doorgegeven die zijn vereist via deze methode, zodat de stap kan worden toegevoegd aan een pijplijngrafiek die de werkstroom vertegenwoordigt.

create_node

Maak een knooppunt uit de AzureBatch-stap en voeg dit toe aan de opgegeven grafiek.

Deze methode is niet bedoeld om rechtstreeks te worden gebruikt. Wanneer een pijplijn met deze stap wordt geïnstantieerd, worden in Azure ML automatisch de parameters doorgegeven die zijn vereist via deze methode, zodat de stap kan worden toegevoegd aan een pijplijngrafiek die de werkstroom vertegenwoordigt.

create_node(graph, default_datastore, context)

Parameters

Name Description
graph
Vereist

Het grafiekobject waaraan het knooppunt moet worden toegevoegd.

default_datastore
Vereist

Het standaardgegevensarchief.

context
Vereist
<xref:azureml.pipeline.core._GraphContext>

De grafiekcontext.

Retouren

Type Description

Het gemaakte knooppunt.