AzureBatchStep Klasa

Tworzy krok potoku usługi Azure ML na potrzeby przesyłania zadań do usługi Azure Batch.

Uwaga: ten krok nie obsługuje przekazywania/pobierania katalogów i ich zawartości.

Przykład użycia narzędzia AzureBatchStep można znaleźć w notesie https://aka.ms/pl-azbatch.

Utwórz krok potoku usługi Azure ML na potrzeby przesyłania zadań do usługi Azure Batch.

Konstruktor

AzureBatchStep(name, create_pool=False, pool_id=None, delete_batch_job_after_finish=True, delete_batch_pool_after_finish=False, is_positive_exit_code_failure=True, vm_image_urn='urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter', run_task_as_admin=False, target_compute_nodes=1, vm_size='standard_d1_v2', source_directory=None, executable=None, arguments=None, inputs=None, outputs=None, allow_reuse=True, compute_target=None, version=None)

Parametry

Nazwa	Opis
name Wymagane	str [Wymagane] Nazwa kroku.
create_pool	bool Wskazuje, czy należy utworzyć pulę przed uruchomieniem zadań. Domyślna wartość: False
pool_id	str [Wymagane] Identyfikator puli, w której jest uruchamiane zadanie. Identyfikator może być istniejącą pulą lub pulą, która zostanie utworzona po przesłaniu zadania. Domyślna wartość: None
delete_batch_job_after_finish	bool Wskazuje, czy zadanie ma zostać usunięte z konta usługi Batch po zakończeniu. Domyślna wartość: True
delete_batch_pool_after_finish	bool Wskazuje, czy należy usunąć pulę po zakończeniu zadania. Domyślna wartość: False
is_positive_exit_code_failure	bool Wskazuje, czy zadanie kończy się niepowodzeniem, jeśli zadanie istnieje z kodem dodatnim. Domyślna wartość: True
vm_image_urn	str Jeśli `create_pool` ma wartość True, a maszyna wirtualna używa funkcji VirtualMachineConfiguration. Format wartości: `urn:publisher:offer:sku`. Przykład: `urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter`. Domyślna wartość: urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter
run_task_as_admin	bool Wskazuje, czy zadanie powinno być uruchamiane z uprawnieniami administratora. Domyślna wartość: False
target_compute_nodes	int Jeśli `create_pool` ma wartość True, wskazuje, ile węzłów obliczeniowych zostanie dodanych do puli. Domyślna wartość: 1
vm_size	str Jeśli `create_pool` ma wartość True, wskazuje rozmiar maszyny wirtualnej węzłów obliczeniowych. Domyślna wartość: standard_d1_v2
source_directory	str Folder lokalny zawierający pliki binarne modułu, plik wykonywalny, zestawy itp. Domyślna wartość: None
executable	str [Wymagane] Nazwa polecenia/pliku wykonywalnego, który zostanie wykonany w ramach zadania. Domyślna wartość: None
arguments	str Argumenty polecenia/pliku wykonywalnego. Domyślna wartość: None
inputs	list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData]] Lista powiązań portów wejściowych. Przed uruchomieniem zadania zostanie utworzony folder dla każdego danych wejściowych. Pliki dla poszczególnych danych wejściowych zostaną skopiowane z magazynu do odpowiedniego folderu w węźle obliczeniowym. Jeśli na przykład nazwa wejściowa to input1, a ścieżka względna w magazynie to niektóre/względne/ścieżka/że/może/być/naprawdę/long/inputfile.txt, ścieżka pliku w obliczeniach będzie następująca: ./input1/inputfile.txt. Gdy nazwa danych wejściowych jest dłuższa niż 32 znaki, zostanie obcięta i dołączona z unikatowym sufiksem, aby nazwa folderu mogła zostać pomyślnie utworzona na docelowym obiekcie obliczeniowym. Domyślna wartość: None
outputs	list[Union[PipelineData, PipelineOutputAbstractDataset, OutputPortBinding]] Lista powiązań portów wyjściowych. Podobnie jak w przypadku danych wejściowych, przed uruchomieniem zadania zostanie utworzony folder dla każdego danych wyjściowych. Nazwa folderu będzie taka sama jak nazwa danych wyjściowych. Założeniem jest to, że zadanie umieści dane wyjściowe w tym folderze. Domyślna wartość: None
allow_reuse	bool Wskazuje, czy krok powinien ponownie używać poprzednich wyników podczas ponownego uruchamiania z tymi samymi ustawieniami. Ponowne użycie jest domyślnie włączone. Jeśli zawartość kroku (skrypty/zależności), a także dane wejściowe i parametry pozostają niezmienione, dane wyjściowe z poprzedniego przebiegu tego kroku są ponownie używane. Podczas ponownego wykonywania kroku zamiast przesyłania zadania do obliczeń wyniki z poprzedniego przebiegu są natychmiast udostępniane wszelkim kolejnym krokom. Jeśli używasz zestawów danych usługi Azure Machine Learning jako danych wejściowych, ponowne użycie zależy od tego, czy definicja zestawu danych uległa zmianie, a nie przez to, czy dane bazowe uległy zmianie. Domyślna wartość: True
compute_target	BatchCompute, str [Wymagane] Usługa BatchCompute oblicza, w którym jest uruchamiane zadanie. Domyślna wartość: None
version	str Opcjonalny tag wersji, aby oznaczyć zmianę funkcjonalności modułu. Domyślna wartość: None
name Wymagane	str [Wymagane] Nazwa kroku.
create_pool Wymagane	bool Wskazuje, czy należy utworzyć pulę przed uruchomieniem zadań.
pool_id Wymagane	str [Wymagane] Identyfikator puli, w której jest uruchamiane zadanie. Identyfikator może być istniejącą pulą lub pulą, która zostanie utworzona po przesłaniu zadania.
delete_batch_job_after_finish Wymagane	bool Wskazuje, czy zadanie ma zostać usunięte z konta usługi Batch po zakończeniu.
delete_batch_pool_after_finish Wymagane	bool Wskazuje, czy należy usunąć pulę po zakończeniu zadania.
is_positive_exit_code_failure Wymagane	bool Wskazuje, czy zadanie kończy się niepowodzeniem, jeśli zadanie istnieje z kodem dodatnim.
vm_image_urn Wymagane	str Jeśli `create_pool` ma wartość True, a maszyna wirtualna używa funkcji VirtualMachineConfiguration. Format wartości: `urn:publisher:offer:sku`. Przykład: `urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter`.
run_task_as_admin Wymagane	bool Wskazuje, czy zadanie powinno być uruchamiane z uprawnieniami administratora.
target_compute_nodes Wymagane	int Jeśli `create_pool` ma wartość True, wskazuje, ile węzłów obliczeniowych zostanie dodanych do puli.
vm_size Wymagane	str Jeśli `create_pool` ma wartość True, wskazuje rozmiar maszyny wirtualnej węzłów obliczeniowych.
source_directory Wymagane	str Folder lokalny zawierający pliki binarne modułu, plik wykonywalny, zestawy itp.
executable Wymagane	str [Wymagane] Nazwa polecenia/pliku wykonywalnego, który zostanie wykonany w ramach zadania.
arguments Wymagane	list Argumenty polecenia/pliku wykonywalnego.
inputs Wymagane	list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData]] Lista powiązań portów wejściowych. Przed uruchomieniem zadania zostanie utworzony folder dla każdego danych wejściowych. Pliki dla poszczególnych danych wejściowych zostaną skopiowane z magazynu do odpowiedniego folderu w węźle obliczeniowym. Jeśli na przykład nazwa wejściowa to input1, a ścieżka względna w magazynie to niektóre/względne/ścieżka/że/może/być/naprawdę/long/inputfile.txt, ścieżka pliku w obliczeniach będzie następująca: ./input1/inputfile.txt. W przypadku, gdy nazwa danych wejściowych jest dłuższa niż 32 znaki, zostanie obcięta i dołączona z unikatowym sufiksem, aby nazwa folderu mogła zostać pomyślnie utworzona na obliczeniach.
outputs Wymagane	list[Union[PipelineData, PipelineOutputAbstractDataset, OutputPortBinding]] Lista powiązań portów wyjściowych. Podobnie jak w przypadku danych wejściowych, przed uruchomieniem zadania zostanie utworzony folder dla każdego danych wyjściowych. Nazwa folderu będzie taka sama jak nazwa danych wyjściowych. Założeniem jest to, że zadanie będzie mieć dane wyjściowe do tego folderu.
allow_reuse Wymagane	bool Wskazuje, czy krok powinien ponownie używać poprzednich wyników podczas ponownego uruchamiania z tymi samymi ustawieniami. Ponowne użycie jest domyślnie włączone. Jeśli zawartość kroku (skrypty/zależności), a także dane wejściowe i parametry pozostają niezmienione, dane wyjściowe z poprzedniego przebiegu tego kroku są ponownie używane. Podczas ponownego wykonywania kroku zamiast przesyłania zadania do obliczeń wyniki z poprzedniego przebiegu są natychmiast udostępniane wszelkim kolejnym krokom. Jeśli używasz zestawów danych usługi Azure Machine Learning jako danych wejściowych, ponowne użycie zależy od tego, czy definicja zestawu danych uległa zmianie, a nie przez to, czy dane bazowe uległy zmianie.
compute_target Wymagane	BatchCompute, str [Wymagane] Usługa BatchCompute oblicza, w którym jest uruchamiane zadanie.
version Wymagane	str Opcjonalny tag wersji, aby oznaczyć zmianę funkcjonalności modułu.

Uwagi

W poniższym przykładzie pokazano, jak używać narzędzia AzureBatchStep w potoku usługi Azure Machine Learning.


   step = AzureBatchStep(
               name="Azure Batch Job",
               pool_id="MyPoolName", # Replace this with the pool name of your choice
               inputs=[testdata],
               outputs=[outputdata],
               executable="azurebatch.cmd",
               arguments=[testdata, outputdata],
               compute_target=batch_compute,
               source_directory=binaries_folder,
   )

Pełny przykład jest dostępny w witrynie https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-how-to-use-azurebatch-to-run-a-windows-executable.ipynb

Metody

create_node

Utwórz węzeł z kroku AzureBatch i dodaj go do określonego grafu.

Ta metoda nie jest przeznaczona do bezpośredniego użycia. Po utworzeniu wystąpienia potoku w tym kroku usługa Azure ML automatycznie przekazuje parametry wymagane za pośrednictwem tej metody, aby można było dodać krok do grafu potoku reprezentującego przepływ pracy.

create_node

Utwórz węzeł z kroku AzureBatch i dodaj go do określonego grafu.

create_node(graph, default_datastore, context)

Parametry

Nazwa	Opis
graph Wymagane	Graph Obiekt grafu, do który ma zostać dodany węzeł.
default_datastore Wymagane	Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore] Domyślny magazyn danych.
context Wymagane	<xref:azureml.pipeline.core._GraphContext> Kontekst grafu.

Zwraca

Typ	Opis
Node	Utworzony węzeł.

Sprzężenie zwrotne

Czy ta strona była pomocna?

Udostępnij za pomocą

AzureBatchStep Klasa

Konstruktor

Parametry

Uwagi

Metody

create_node

Parametry

Zwraca

Sprzężenie zwrotne