AzureBatchStep Klas

Referentie

Hiermee maakt u een Azure ML-pijplijnstap voor het verzenden van taken naar Azure Batch.

Opmerking: deze stap biedt geen ondersteuning voor het uploaden/downloaden van mappen en de inhoud ervan.

Zie het notebook https://aka.ms/pl-azbatchvoor een voorbeeld van het gebruik van AzureBatchStep.

Maak een Azure ML-pijplijnstap voor het verzenden van taken naar Azure Batch.

Overname: azureml.pipeline.core._azurebatch_step_base._AzureBatchStepBase

AzureBatchStep

Constructor

AzureBatchStep(name, create_pool=False, pool_id=None, delete_batch_job_after_finish=True, delete_batch_pool_after_finish=False, is_positive_exit_code_failure=True, vm_image_urn='urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter', run_task_as_admin=False, target_compute_nodes=1, vm_size='standard_d1_v2', source_directory=None, executable=None, arguments=None, inputs=None, outputs=None, allow_reuse=True, compute_target=None, version=None)

Parameters

Name	Description
name Vereist	str [Vereist] De naam van de stap.
create_pool	bool Geeft aan of de pool moet worden gemaakt voordat de taken worden uitgevoerd. Default value: False
pool_id	str [Vereist] De id van de pool waarin de taak wordt uitgevoerd. De id kan een bestaande pool zijn of een die wordt gemaakt wanneer de taak wordt verzonden. Default value: None
delete_batch_job_after_finish	bool Geeft aan of de taak uit het Batch-account moet worden verwijderd nadat deze is voltooid. Default value: True
delete_batch_pool_after_finish	bool Geeft aan of de pool moet worden verwijderd nadat de taak is voltooid. Default value: False
is_positive_exit_code_failure	bool Geeft aan of de taak mislukt als de taak bestaat met een positieve code. Default value: True
vm_image_urn	str Als `create_pool` waar is en de VM VirtualMachineConfiguration gebruikt. Waarde-indeling: `urn:publisher:offer:sku`. Bijvoorbeeld: `urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter`. Default value: urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter
run_task_as_admin	bool Hiermee wordt aangegeven of de taak moet worden uitgevoerd met beheerdersbevoegdheden. Default value: False
target_compute_nodes	int Als `create_pool` Waar is, wordt aangegeven hoeveel rekenknooppunten aan de pool worden toegevoegd. Default value: 1
vm_size	str Als `create_pool` true is, geeft de grootte van de virtuele machine van de rekenknooppunten aan. Default value: standard_d1_v2
source_directory	str Een lokale map die de binaire bestanden van de module, het uitvoerbare bestand, assembly's, enzovoort bevat. Default value: None
executable	str [Vereist] De naam van de opdracht/het uitvoerbare bestand dat wordt uitgevoerd als onderdeel van de taak. Default value: None
arguments	str Argumenten voor de opdracht/het uitvoerbare bestand. Default value: None
inputs	list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData]] Een lijst met invoerpoortbindingen. Voordat de taak wordt uitgevoerd, wordt er een map gemaakt voor elke invoer. De bestanden voor elke invoer worden gekopieerd van de opslag naar de respectieve map op het rekenknooppunt. Als de invoernaam bijvoorbeeld input1 is en het relatieve pad in de opslag sommige/relatief/pad/dat/kan/echt/lang/inputfile.txtis, is het bestandspad op de berekening : ./input1/inputfile.txt. Wanneer de invoernaam langer is dan 32 tekens, wordt deze afgekapt en toegevoegd met een uniek achtervoegsel, zodat de mapnaam kan worden gemaakt op het rekendoel. Default value: None
outputs	list[Union[PipelineData, PipelineOutputAbstractDataset, OutputPortBinding]] Een lijst met uitvoerpoortbindingen. Net als bij invoer wordt voor elke uitvoer een map gemaakt voordat de taak wordt uitgevoerd. De naam van de map is hetzelfde als de naam van de uitvoer. De veronderstelling is dat de taak de uitvoer in die map plaatst. Default value: None
allow_reuse	bool Hiermee wordt aangegeven of de stap eerdere resultaten opnieuw moet gebruiken wanneer deze opnieuw wordt uitgevoerd met dezelfde instellingen. Hergebruik is standaard ingeschakeld. Als de inhoud van de stap (scripts/afhankelijkheden) en de invoer en parameters ongewijzigd blijven, wordt de uitvoer van de vorige uitvoering van deze stap opnieuw gebruikt. Wanneer u de stap opnieuw gebruikt, worden de resultaten van de vorige uitvoering onmiddellijk beschikbaar gemaakt voor eventuele volgende stappen in plaats van de taak te verzenden om te berekenen. Als u Azure Machine Learning-gegevenssets als invoer gebruikt, wordt hergebruik bepaald door of de definitie van de gegevensset is gewijzigd, niet door of de onderliggende gegevens zijn gewijzigd. Default value: True
compute_target	BatchCompute, str [Vereist] Een BatchCompute-berekening waarop de taak wordt uitgevoerd. Default value: None
version	str Een optionele versietag om een wijziging in de functionaliteit voor de module aan te geven. Default value: None
name Vereist	str [Vereist] De naam van de stap.
create_pool Vereist	bool Geeft aan of de pool moet worden gemaakt voordat de taken worden uitgevoerd.
pool_id Vereist	str [Vereist] De id van de pool waarin de taak wordt uitgevoerd. De id kan een bestaande pool zijn of een die wordt gemaakt wanneer de taak wordt verzonden.
delete_batch_job_after_finish Vereist	bool Geeft aan of de taak uit het Batch-account moet worden verwijderd nadat deze is voltooid.
delete_batch_pool_after_finish Vereist	bool Geeft aan of de pool moet worden verwijderd nadat de taak is voltooid.
is_positive_exit_code_failure Vereist	bool Geeft aan of de taak mislukt als de taak bestaat met een positieve code.
vm_image_urn Vereist	str Als `create_pool` waar is en de VM VirtualMachineConfiguration gebruikt. Waarde-indeling: `urn:publisher:offer:sku`. Bijvoorbeeld: `urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter`.
run_task_as_admin Vereist	bool Hiermee wordt aangegeven of de taak moet worden uitgevoerd met beheerdersbevoegdheden.
target_compute_nodes Vereist	int Als `create_pool` Waar is, wordt aangegeven hoeveel rekenknooppunten aan de pool worden toegevoegd.
vm_size Vereist	str Als `create_pool` true is, geeft de grootte van de virtuele machine van de rekenknooppunten aan.
source_directory Vereist	str Een lokale map met de binaire bestanden van de module, het uitvoerbare bestand, assembly's, enzovoort.
executable Vereist	str [Vereist] De naam van de opdracht/het uitvoerbare bestand dat wordt uitgevoerd als onderdeel van de taak.
arguments Vereist	list Argumenten voor de opdracht/het uitvoerbare bestand.
inputs Vereist	list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData]] Een lijst met invoerpoortbindingen. Voordat de taak wordt uitgevoerd, wordt er een map gemaakt voor elke invoer. De bestanden voor elke invoer worden gekopieerd van de opslag naar de respectieve map op het rekenknooppunt. Als de invoernaam bijvoorbeeld input1 is en het relatieve pad in de opslag sommige/relatief/pad/dat/kan/echt/lang/inputfile.txtis, is het bestandspad op de berekening : ./input1/inputfile.txt. Als de invoernaam langer is dan 32 tekens, wordt deze afgekapt en toegevoegd met een uniek achtervoegsel, zodat de mapnaam kan worden gemaakt op de berekening.
outputs Vereist	list[Union[PipelineData, PipelineOutputAbstractDataset, OutputPortBinding]] Een lijst met uitvoerpoortbindingen. Net als bij invoer wordt voor elke uitvoer een map gemaakt voordat de taak wordt uitgevoerd. De naam van de map is hetzelfde als de naam van de uitvoer. De veronderstelling is dat de taak de uitvoer naar die map heeft.
allow_reuse Vereist	bool Hiermee wordt aangegeven of de stap eerdere resultaten opnieuw moet gebruiken wanneer deze opnieuw wordt uitgevoerd met dezelfde instellingen. Hergebruik is standaard ingeschakeld. Als de inhoud van de stap (scripts/afhankelijkheden) en de invoer en parameters ongewijzigd blijven, wordt de uitvoer van de vorige uitvoering van deze stap opnieuw gebruikt. Wanneer u de stap opnieuw gebruikt, worden de resultaten van de vorige uitvoering onmiddellijk beschikbaar gemaakt voor eventuele volgende stappen in plaats van de taak te verzenden om te berekenen. Als u Azure Machine Learning-gegevenssets als invoer gebruikt, wordt hergebruik bepaald door of de definitie van de gegevensset is gewijzigd, niet door of de onderliggende gegevens zijn gewijzigd.
compute_target Vereist	BatchCompute, str [Vereist] Een BatchCompute-berekening waarop de taak wordt uitgevoerd.
version Vereist	str Een optionele versietag om een wijziging in de functionaliteit voor de module aan te geven.

Opmerkingen

In het volgende voorbeeld ziet u hoe u AzureBatchStep gebruikt in een Azure Machine Learning-pijplijn.


   step = AzureBatchStep(
               name="Azure Batch Job",
               pool_id="MyPoolName", # Replace this with the pool name of your choice
               inputs=[testdata],
               outputs=[outputdata],
               executable="azurebatch.cmd",
               arguments=[testdata, outputdata],
               compute_target=batch_compute,
               source_directory=binaries_folder,
   )

Volledig voorbeeld is beschikbaar via https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-how-to-use-azurebatch-to-run-a-windows-executable.ipynb

Methoden

create_node

Maak een knooppunt uit de AzureBatch-stap en voeg dit toe aan de opgegeven grafiek.

Deze methode is niet bedoeld om rechtstreeks te worden gebruikt. Wanneer een pijplijn wordt geïnstantieerd met deze stap, geeft Azure ML automatisch de vereiste parameters door via deze methode, zodat deze stap kan worden toegevoegd aan een pijplijngrafiek die de werkstroom vertegenwoordigt.

create_node

Maak een knooppunt uit de AzureBatch-stap en voeg dit toe aan de opgegeven grafiek.

create_node(graph, default_datastore, context)

Parameters

Name	Description
graph Vereist	Graph Het grafiekobject waaraan u het knooppunt wilt toevoegen.
default_datastore Vereist	Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore] Het standaardgegevensarchief.
context Vereist	<xref:azureml.pipeline.core._GraphContext> De grafiekcontext.

Retouren

Type	Description
Node	Het gemaakte knooppunt.

Delen via

AzureBatchStep Klas

Constructor

Parameters

Opmerkingen

Methoden

create_node

Parameters

Retouren

Feedback

Aanvullende resources