AzureBatchStep 類別
建立 Azure ML 管線步驟,將作業提交至Azure Batch。
注意:此步驟不支援上傳/下載目錄及其內容。
如需使用 AzureBatchStep 的範例,請參閱筆記本 https://aka.ms/pl-azbatch 。
建立 Azure ML 管線步驟,將作業提交至Azure Batch。
- 繼承
-
azureml.pipeline.core._azurebatch_step_base._AzureBatchStepBaseAzureBatchStep
建構函式
AzureBatchStep(name, create_pool=False, pool_id=None, delete_batch_job_after_finish=True, delete_batch_pool_after_finish=False, is_positive_exit_code_failure=True, vm_image_urn='urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter', run_task_as_admin=False, target_compute_nodes=1, vm_size='standard_d1_v2', source_directory=None, executable=None, arguments=None, inputs=None, outputs=None, allow_reuse=True, compute_target=None, version=None)
參數
- vm_image_urn
- str
如果 create_pool
為 True,且 VM 使用 VirtualMachineConfiguration。
值格式: urn:publisher:offer:sku
。
範例: urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter
.
- inputs
- list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData]]
輸入埠系結的清單。 在作業執行之前,會為每個輸入建立資料夾。 每個輸入的檔案都會從儲存體複製到計算節點上的個別資料夾。 例如,如果輸入名稱是 input1,而儲存體上的相對路徑是 一些/relative/path/that/can/be/really/long/inputfile.txt,則計算上的檔案路徑會是: ./input1/inputfile.txt。 當輸入名稱超過 32 個字元時,將會截斷並附加唯一尾碼,以便在計算目標上成功建立資料夾名稱。
輸出埠系結的清單。 類似于輸入,在作業執行之前,會為每個輸出建立資料夾。 資料夾名稱會與輸出名稱相同。 假設作業會將輸出放入該資料夾中。
- allow_reuse
- bool
指出當使用相同的設定重新執行時,此步驟是否應該重複使用先前的結果。 預設會啟用重複使用。 如果步驟內容 (腳本/相依性) 以及輸入和參數保持不變,則會重複使用此步驟上一次執行的輸出。 重複使用步驟時,不會提交要計算的作業,而是立即提供給任何後續步驟使用上一次執行的結果。 如果您使用 Azure Machine Learning 資料集作為輸入,重複使用取決於資料集的定義是否已變更,而不是基礎資料是否已變更。
- vm_image_urn
- str
如果 create_pool
為 True,且 VM 使用 VirtualMachineConfiguration。
值格式: urn:publisher:offer:sku
。
範例: urn:MicrosoftWindowsServer:WindowsServer:2012-R2-Datacenter
.
- inputs
- list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData]]
輸入埠系結的清單。 在作業執行之前,會為每個輸入建立資料夾。 每個輸入的檔案都會從儲存體複製到計算節點上的個別資料夾。 例如,如果輸入名稱是 input1,而儲存體上的相對路徑是 一些/relative/path/that/can/be/really/long/inputfile.txt,則計算上的檔案路徑會是: ./input1/inputfile.txt。 如果輸入名稱超過 32 個字元,則會截斷並附加唯一尾碼,因此可以在計算上成功建立資料夾名稱。
輸出埠系結的清單。 類似于輸入,在作業執行之前,會為每個輸出建立資料夾。 資料夾名稱會與輸出名稱相同。 假設作業將具有該資料夾中的輸出。
- allow_reuse
- bool
指出當使用相同的設定重新執行時,此步驟是否應該重複使用先前的結果。 預設會啟用重複使用。 如果步驟內容 (腳本/相依性) 以及輸入和參數保持不變,則會重複使用此步驟上一次執行的輸出。 重複使用步驟時,不會提交要計算的作業,而是立即提供給任何後續步驟使用上一次執行的結果。 如果您使用 Azure Machine Learning 資料集作為輸入,重複使用取決於資料集的定義是否已變更,而不是基礎資料是否已變更。
備註
下列範例示範如何在 Azure Machine Learning 管線中使用 AzureBatchStep。
step = AzureBatchStep(
name="Azure Batch Job",
pool_id="MyPoolName", # Replace this with the pool name of your choice
inputs=[testdata],
outputs=[outputdata],
executable="azurebatch.cmd",
arguments=[testdata, outputdata],
compute_target=batch_compute,
source_directory=binaries_folder,
)
方法
create_node |
從 AzureBatch 步驟建立節點,並將其新增至指定的圖形。 這個方法不適合直接使用。 使用此步驟具現化管線時,Azure ML 會自動傳遞透過此方法所需的參數,以便將步驟新增至代表工作流程的管線圖形。 |
create_node
從 AzureBatch 步驟建立節點,並將其新增至指定的圖形。
這個方法不適合直接使用。 使用此步驟具現化管線時,Azure ML 會自動傳遞透過此方法所需的參數,以便將步驟新增至代表工作流程的管線圖形。
create_node(graph, default_datastore, context)
參數
- context
- <xref:azureml.pipeline.core._GraphContext>
圖形內容。
傳回
已建立的節點。
傳回類型
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應