AzureBatchStep Klas

Hiermee maakt u een Azure ML-pijplijnstap voor het verzenden van taken naar Azure Batch.

Opmerking: deze stap biedt geen ondersteuning voor het uploaden/downloaden van mappen en hun inhoud.

Zie het notebook https://aka.ms/pl-azbatchvoor een voorbeeld van het gebruik van AzureBatchStep.

Maak een Azure ML-pijplijnstap voor het verzenden van taken naar Azure Batch.

Constructor

AzureBatchStep(name, create_pool=False, pool_id=None, delete_batch_job_after_finish=True, delete_batch_pool_after_finish=False, is_positive_exit_code_failure=True, vm_image_urn='urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter', run_task_as_admin=False, target_compute_nodes=1, vm_size='standard_d1_v2', source_directory=None, executable=None, arguments=None, inputs=None, outputs=None, allow_reuse=True, compute_target=None, version=None)

Parameters

Name	Description
name Vereist	str [Vereist] De naam van de stap.
create_pool	bool Geeft aan of de pool moet worden gemaakt voordat de taken worden uitgevoerd. Default value: False
pool_id	str [Vereist] De id van de pool waar de taak wordt uitgevoerd. De id kan een bestaande pool zijn of een pool die wordt gemaakt wanneer de taak wordt verzonden. Default value: None
delete_batch_job_after_finish	bool Geeft aan of de taak uit het Batch-account moet worden verwijderd nadat deze is voltooid. Default value: True
delete_batch_pool_after_finish	bool Geeft aan of de pool moet worden verwijderd nadat de taak is voltooid. Default value: False
is_positive_exit_code_failure	bool Geeft aan of de taak mislukt als de taak bestaat met een positieve code. Default value: True
vm_image_urn	str Als `create_pool` waar is en vm VirtualMachineConfiguration gebruikt. Waardenotatie: `urn:publisher:offer:sku`. Voorbeeld: `urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter`. Default value: urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter
run_task_as_admin	bool Hiermee wordt aangegeven of de taak moet worden uitgevoerd met beheerdersbevoegdheden. Default value: False
target_compute_nodes	int Als `create_pool` waar is, geeft u aan hoeveel rekenknooppunten aan de pool worden toegevoegd. Default value: 1
vm_size	str Als `create_pool` waar is, geeft u de grootte van de virtuele machine van de rekenknooppunten aan. Default value: standard_d1_v2
source_directory	str Een lokale map die de binaire modulebestanden, uitvoerbare bestanden, assembly's, enzovoort bevat. Default value: None
executable	str [Vereist] De naam van de opdracht/het uitvoerbare bestand dat wordt uitgevoerd als onderdeel van de taak. Default value: None
arguments	str Argumenten voor de opdracht/het uitvoerbare bestand. Default value: None
inputs	list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData]] Een lijst met invoerpoortbindingen. Voordat de taak wordt uitgevoerd, wordt er voor elke invoer een map gemaakt. De bestanden voor elke invoer worden gekopieerd van de opslag naar de respectieve map op het rekenknooppunt. Als de invoernaam bijvoorbeeld invoer1 is en het relatieve pad in de opslag een of ander/relatief/pad/dat/kan/echt/lang/inputfile.txt, dan is het bestandspad op de berekening: ./input1/inputfile.txt. Wanneer de invoernaam langer is dan 32 tekens, wordt deze afgekapt en toegevoegd met een uniek achtervoegsel, zodat de mapnaam kan worden gemaakt op het rekendoel. Default value: None
outputs	list[Union[PipelineData, PipelineOutputAbstractDataset, OutputPortBinding]] Een lijst met uitvoerpoortbindingen. Net als bij invoer wordt voordat de taak wordt uitgevoerd, wordt er voor elke uitvoer een map gemaakt. De mapnaam is hetzelfde als de uitvoernaam. De veronderstelling is dat de taak de uitvoer in die map plaatst. Default value: None
allow_reuse	bool Hiermee wordt aangegeven of de stap vorige resultaten opnieuw moet gebruiken wanneer deze opnieuw wordt uitgevoerd met dezelfde instellingen. Hergebruik is standaard ingeschakeld. Als de inhoud van de stap (scripts/afhankelijkheden) en de invoer en parameters ongewijzigd blijven, wordt de uitvoer van de vorige uitvoering van deze stap opnieuw gebruikt. Wanneer u de stap opnieuw gebruikt, worden de resultaten van de vorige uitvoering onmiddellijk beschikbaar gesteld aan eventuele volgende stappen in plaats van de taak te verzenden om te berekenen. Als u Azure Machine Learning-gegevenssets als invoer gebruikt, wordt hergebruik bepaald door of de definitie van de gegevensset is gewijzigd, niet door of de onderliggende gegevens zijn gewijzigd. Default value: True
compute_target	BatchCompute, str [Vereist] Een BatchCompute-berekening waar de taak wordt uitgevoerd. Default value: None
version	str Een optionele versietag om een wijziging in functionaliteit voor de module aan te geven. Default value: None
name Vereist	str [Vereist] De naam van de stap.
create_pool Vereist	bool Geeft aan of de pool moet worden gemaakt voordat de taken worden uitgevoerd.
pool_id Vereist	str [Vereist] De id van de pool waar de taak wordt uitgevoerd. De id kan een bestaande pool zijn of een pool die wordt gemaakt wanneer de taak wordt verzonden.
delete_batch_job_after_finish Vereist	bool Geeft aan of de taak uit het Batch-account moet worden verwijderd nadat deze is voltooid.
delete_batch_pool_after_finish Vereist	bool Geeft aan of de pool moet worden verwijderd nadat de taak is voltooid.
is_positive_exit_code_failure Vereist	bool Geeft aan of de taak mislukt als de taak bestaat met een positieve code.
vm_image_urn Vereist	str Als `create_pool` waar is en vm VirtualMachineConfiguration gebruikt. Waardenotatie: `urn:publisher:offer:sku`. Voorbeeld: `urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter`.
run_task_as_admin Vereist	bool Hiermee wordt aangegeven of de taak moet worden uitgevoerd met beheerdersbevoegdheden.
target_compute_nodes Vereist	int Als `create_pool` waar is, geeft u aan hoeveel rekenknooppunten aan de pool worden toegevoegd.
vm_size Vereist	str Als `create_pool` waar is, geeft u de grootte van de virtuele machine van de rekenknooppunten aan.
source_directory Vereist	str Een lokale map die de binaire modulebestanden, uitvoerbare bestanden, assembly's enzovoort bevat.
executable Vereist	str [Vereist] De naam van de opdracht/het uitvoerbare bestand dat wordt uitgevoerd als onderdeel van de taak.
arguments Vereist	list Argumenten voor de opdracht/het uitvoerbare bestand.
inputs Vereist	list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData]] Een lijst met invoerpoortbindingen. Voordat de taak wordt uitgevoerd, wordt er voor elke invoer een map gemaakt. De bestanden voor elke invoer worden gekopieerd van de opslag naar de respectieve map op het rekenknooppunt. Als de invoernaam bijvoorbeeld invoer1 is en het relatieve pad in de opslag een of ander/relatief/pad/dat/kan/echt/lang/inputfile.txt, dan is het bestandspad op de berekening: ./input1/inputfile.txt. Als de invoernaam langer is dan 32 tekens, wordt deze afgekapt en toegevoegd met een uniek achtervoegsel, zodat de mapnaam kan worden gemaakt op de berekening.
outputs Vereist	list[Union[PipelineData, PipelineOutputAbstractDataset, OutputPortBinding]] Een lijst met uitvoerpoortbindingen. Net als bij invoer wordt voordat de taak wordt uitgevoerd, wordt er voor elke uitvoer een map gemaakt. De mapnaam is hetzelfde als de uitvoernaam. De veronderstelling is dat de taak de uitvoer in die map heeft.
allow_reuse Vereist	bool Hiermee wordt aangegeven of de stap vorige resultaten opnieuw moet gebruiken wanneer deze opnieuw wordt uitgevoerd met dezelfde instellingen. Hergebruik is standaard ingeschakeld. Als de inhoud van de stap (scripts/afhankelijkheden) en de invoer en parameters ongewijzigd blijven, wordt de uitvoer van de vorige uitvoering van deze stap opnieuw gebruikt. Wanneer u de stap opnieuw gebruikt, worden de resultaten van de vorige uitvoering onmiddellijk beschikbaar gesteld aan eventuele volgende stappen in plaats van de taak te verzenden om te berekenen. Als u Azure Machine Learning-gegevenssets als invoer gebruikt, wordt hergebruik bepaald door of de definitie van de gegevensset is gewijzigd, niet door of de onderliggende gegevens zijn gewijzigd.
compute_target Vereist	BatchCompute, str [Vereist] Een BatchCompute-berekening waar de taak wordt uitgevoerd.
version Vereist	str Een optionele versietag om een wijziging in functionaliteit voor de module aan te geven.

Opmerkingen

In het volgende voorbeeld ziet u hoe u AzureBatchStep gebruikt in een Azure Machine Learning-pijplijn.


   step = AzureBatchStep(
               name="Azure Batch Job",
               pool_id="MyPoolName", # Replace this with the pool name of your choice
               inputs=[testdata],
               outputs=[outputdata],
               executable="azurebatch.cmd",
               arguments=[testdata, outputdata],
               compute_target=batch_compute,
               source_directory=binaries_folder,
   )

Volledig voorbeeld is beschikbaar vanaf https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-how-to-use-azurebatch-to-run-a-windows-executable.ipynb

Methoden

create_node

Maak een knooppunt uit de AzureBatch-stap en voeg dit toe aan de opgegeven grafiek.

Deze methode is niet bedoeld om rechtstreeks te worden gebruikt. Wanneer een pijplijn met deze stap wordt geïnstantieerd, worden in Azure ML automatisch de parameters doorgegeven die zijn vereist via deze methode, zodat de stap kan worden toegevoegd aan een pijplijngrafiek die de werkstroom vertegenwoordigt.

create_node

Maak een knooppunt uit de AzureBatch-stap en voeg dit toe aan de opgegeven grafiek.

create_node(graph, default_datastore, context)

Parameters

Name	Description
graph Vereist	Graph Het grafiekobject waaraan het knooppunt moet worden toegevoegd.
default_datastore Vereist	Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore] Het standaardgegevensarchief.
context Vereist	<xref:azureml.pipeline.core._GraphContext> De grafiekcontext.

Retouren

Type	Description
Node	Het gemaakte knooppunt.

Feedback

Is deze pagina nuttig?

Delen via

AzureBatchStep Klas

Constructor

Parameters

Opmerkingen

Methoden

create_node

Parameters

Retouren

Feedback