AzureBatchStep Kelas

Referensi

Membuat langkah Alur Azure Machine Learning untuk mengirimkan pekerjaan ke Azure Batch.

Catatan: Langkah ini tidak mendukung pengunggahan/pengunduhan direktori dan kontennya.

Untuk contoh menggunakan AzureBatchStep, lihat buku catatan https://aka.ms/pl-azbatch.

Buat langkah Azure ML Pipeline untuk mengirimkan pekerjaan ke Azure Batch.

Warisan: azureml.pipeline.core._azurebatch_step_base._AzureBatchStepBase

AzureBatchStep

Konstruktor

AzureBatchStep(name, create_pool=False, pool_id=None, delete_batch_job_after_finish=True, delete_batch_pool_after_finish=False, is_positive_exit_code_failure=True, vm_image_urn='urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter', run_task_as_admin=False, target_compute_nodes=1, vm_size='standard_d1_v2', source_directory=None, executable=None, arguments=None, inputs=None, outputs=None, allow_reuse=True, compute_target=None, version=None)

Parameter

name: str

Diperlukan

[Diperlukan] Nama langkahnya.

create_pool: bool

nilai default: False

Menunjukkan apakah akan membuat kumpulan sebelum menjalankan pekerjaan.

pool_id: str

nilai default: None

[Diperlukan] ID kumpulan tempat pekerjaan berjalan. ID dapat menjadi kumpulan yang ada, atau yang akan dibuat saat pekerjaan dikirimkan.

delete_batch_job_after_finish: bool

nilai default: True

Menunjukkan apakah akan menghapus pekerjaan dari akun Batch setelah selesai.

delete_batch_pool_after_finish: bool

nilai default: False

Menunjukkan apakah akan menghapus kumpulan setelah pekerjaan selesai.

is_positive_exit_code_failure: bool

nilai default: True

Menunjukkan apakah pekerjaan gagal jika tugas ada dengan kode positif.

vm_image_urn: str

nilai default: urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter

Jika create_pool True dan VM menggunakan VirtualMachineConfiguration. Format nilai: urn:publisher:offer:sku. Contoh: urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter.

run_task_as_admin: bool

nilai default: False

Menunjukkan apakah tugas harus berjalan dengan hak istimewa admin.

target_compute_nodes: int

nilai default: 1

Jika create_pool adalah True, menunjukkan berapa banyak simpul komputasi yang akan ditambahkan ke kumpulan.

vm_size: str

nilai default: standard_d1_v2

Jika create_pool True, menunjukkan ukuran mesin virtual dari node komputasi.

source_directory: str

nilai default: None

Folder lokal yang berisi binari modul, eksekusi, rakitan, dll.

executable: str

nilai default: None

[Diperlukan] Nama perintah/eksekusi yang akan dijalankan sebagai bagian dari pekerjaan.

arguments: str

nilai default: None

Argumen untuk perintah/eksekusi.

inputs: list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData]]

nilai default: None

Daftar pengikatan port input. Sebelum pekerjaan berjalan, folder dibuat untuk setiap input. File untuk setiap input akan disalin dari penyimpanan ke folder masing-masing pada node komputasi. Misalnya, jika nama input adalah input1, dan jalur relatif pada penyimpanan adalah some/relative/path/that/can/be/really/long/inputfile.txt, jalur file pada komputasi akan menjadi: ./input1/inputfile.txt. Ketika nama input lebih panjang dari 32 karakter, itu akan dipotong dan ditambahkan dengan akhiran unik sehingga nama folder dapat berhasil dibuat pada target komputasi.

outputs: list[Union[PipelineData, PipelineOutputAbstractDataset, OutputPortBinding]]

nilai default: None

Daftar pengikatan port output. Mirip dengan input, sebelum pekerjaan berjalan, folder dibuat untuk setiap output. Nama folder akan sama dengan nama output. Asumsinya adalah bahwa pekerjaan akan memasukkan output ke dalam folder itu.

allow_reuse: bool

nilai default: True

Menunjukkan apakah langkah tersebut harus menggunakan kembali hasil sebelumnya saat dijalankan lagi dengan pengaturan yang sama. Penggunaan kembali diaktifkan secara default. Jika konten langkah (skrip/dependensi) serta input dan parameter tetap tidak berubah, output dari eksekusi sebelumnya dari langkah ini digunakan ulang. Saat menggunakan ulang langkah tersebut, daripada mengirimkan pekerjaan ke komputasi, hasil dari eksekusi sebelumnya segera dibuat tersedia untuk langkah selanjutnya. Jika Anda menggunakan himpunan data Azure Machine Learning sebagai input, penggunaan ulang ditentukan oleh apakah definisi himpunan data telah berubah, bukan oleh apakah data yang mendasarinya telah berubah.

compute_target: BatchCompute, str

nilai default: None

[Diperlukan] Komputasi BatchCompute tempat pekerjaan berjalan.

version: str

nilai default: None

Tag versi opsional untuk menunjukkan perubahan fungsionalitas untuk modul.

name: str

Diperlukan

[Diperlukan] Nama langkahnya.

create_pool: bool

Diperlukan

Menunjukkan apakah akan membuat kumpulan sebelum menjalankan pekerjaan.

pool_id: str

Diperlukan

[Diperlukan] ID kumpulan tempat pekerjaan berjalan. ID dapat menjadi kumpulan yang ada, atau yang akan dibuat saat pekerjaan dikirimkan.

delete_batch_job_after_finish: bool

Diperlukan

Menunjukkan apakah akan menghapus pekerjaan dari akun Batch setelah selesai.

delete_batch_pool_after_finish: bool

Diperlukan

Menunjukkan apakah akan menghapus kumpulan setelah pekerjaan selesai.

is_positive_exit_code_failure: bool

Diperlukan

Menunjukkan apakah pekerjaan gagal jika tugas ada dengan kode positif.

vm_image_urn: str

Diperlukan

Jika create_pool True dan VM menggunakan VirtualMachineConfiguration. Format nilai: urn:publisher:offer:sku. Contoh: urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter.

run_task_as_admin: bool

Diperlukan

Menunjukkan apakah tugas harus berjalan dengan hak istimewa admin.

target_compute_nodes: int

Diperlukan

Jika create_pool adalah True, menunjukkan berapa banyak simpul komputasi yang akan ditambahkan ke kumpulan.

vm_size: str

Diperlukan

Jika create_pool True, menunjukkan ukuran Komputer virtual dari simpul komputasi.

source_directory: str

Diperlukan

Folder lokal yang berisi biner modul, dapat dieksekusi, rakitan, dll.

executable: str

Diperlukan

[Diperlukan] Nama perintah/eksekusi yang akan dijalankan sebagai bagian dari pekerjaan.

arguments: list

Diperlukan

Argumen untuk perintah/eksekusi.

inputs: list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData]]

Diperlukan

Daftar pengikatan port input. Sebelum pekerjaan berjalan, folder dibuat untuk setiap input. File untuk setiap input akan disalin dari penyimpanan ke folder masing-masing pada node komputasi. Misalnya, jika nama input adalah input1, dan jalur relatif pada penyimpanan adalah some/relative/path/that/can/be/really/long/inputfile.txt, jalur file pada komputasi akan menjadi: ./input1/inputfile.txt. Jika nama input lebih panjang dari 32 karakter, nama tersebut akan dipotok dan ditambahkan dengan akhiran unik, sehingga nama folder dapat berhasil dibuat pada komputasi.

outputs: list[Union[PipelineData, PipelineOutputAbstractDataset, OutputPortBinding]]

Diperlukan

allow_reuse: bool

Diperlukan

compute_target: BatchCompute, str

Diperlukan

[Diperlukan] Komputasi BatchCompute tempat pekerjaan berjalan.

version: str

Diperlukan

Tag versi opsional untuk menunjukkan perubahan fungsionalitas untuk modul.

Keterangan

Contoh berikut menunjukkan cara menggunakan AzureBatchStep dalam Alur Azure Machine Learning.


   step = AzureBatchStep(
               name="Azure Batch Job",
               pool_id="MyPoolName", # Replace this with the pool name of your choice
               inputs=[testdata],
               outputs=[outputdata],
               executable="azurebatch.cmd",
               arguments=[testdata, outputdata],
               compute_target=batch_compute,
               source_directory=binaries_folder,
   )

Sampel lengkap tersedia dari https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-how-to-use-azurebatch-to-run-a-windows-executable.ipynb

Metode

create_node

Buat node dari langkah AzureBatch dan tambahkan ke grafik yang ditentukan.

Metode ini tidak dimaksudkan untuk digunakan secara langsung. Ketika alur dibuat dengan langkah ini, Azure Machine Learning secara otomatis meneruskan parameter yang diperlukan melalui metode ini sehingga langkah tersebut dapat ditambahkan ke grafik alur yang mewakili alur kerja.

create_node

Buat node dari langkah AzureBatch dan tambahkan ke grafik yang ditentukan.

create_node(graph, default_datastore, context)

Parameter

graph: Graph

Diperlukan

Objek grafik untuk menambahkan node.

default_datastore: Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]

Diperlukan

Datastore default.

context: <xref:azureml.pipeline.core._GraphContext>

Diperlukan

Konteks grafik.

Mengembalikan

Node yang dibuat.

Tipe hasil

Node

Bagikan melalui

AzureBatchStep Kelas

Konstruktor

Parameter

Keterangan

Metode

create_node

Parameter

Mengembalikan

Tipe hasil

Saran dan Komentar

Saran dan Komentar

Sumber Daya Tambahan: