steps 套件

包含可在 Azure Machine Learning 管線中執行的預先建置步驟。

Azure ML 管線步驟可以一起設定,以建構管線,其代表可共用且可重複使用的 Azure Machine Learning 工作流程。 如果步驟內容 (腳本和相依性) ,以及輸入和參數保持不變,管線的每個步驟都可以設定為允許重複使用其先前的執行結果。

此封裝中的類別通常會與封裝中的 core 類別搭配使用。 核心套件包含用來設定資料 (PipelineData) 、排程 () Schedule ,以及管理步驟 (StepRun) 輸出的類別。

此套件中預先建置的步驟涵蓋機器學習工作流程中遇到的許多常見案例。 若要開始使用預先建置的管線步驟,請參閱:

單元

adla_step

包含使用 Azure Data Lake Analytics 執行 U-SQL 腳本的 Azure ML 管線步驟的功能。

automl_step

包含在 Azure Machine Learning 中新增和管理自動化 ML 管線步驟的功能。

azurebatch_step

包含在 Azure Batch 中執行 Windows 可執行檔的 Azure ML 管線步驟的功能。

command_step

包含用來建立執行命令的 Azure ML 管線步驟的功能。

data_transfer_step

包含建立 Azure ML 管線步驟的功能,可在儲存體選項之間傳輸資料。

databricks_step

包含在 DBFS 上建立 Azure ML 管線步驟以執行 Databricks 筆記本或 Python 腳本的功能。

estimator_step

包含建立管線步驟的功能,可執行 Machine Learning 模型定型的估算器。

hyper_drive_step

包含用來建立和管理執行超參數微調之 Azure ML 管線步驟的有趣性。

kusto_step

包含建立 Azure ML 管線步驟以執行 Kusto Notebook 的功能。

module_step

包含使用現有模組版本新增 Azure Machine Learning 管線步驟的功能。

mpi_step

包含新增 Azure ML 管線步驟以執行機器學習模型定型 MPI 作業的功能。

parallel_run_config

包含設定 ParallelRunStep 的功能。

parallel_run_step

包含可在多個 AmlCompute 目標上以平行模式執行使用者腳本的步驟。

python_script_step

包含用來建立執行 Python 腳本的 Azure ML 管線步驟的功能。

r_script_step

包含用來建立執行 R 腳本的 Azure ML 管線步驟的功能。

synapse_spark_step

包含用來建立執行 Python 腳本的 Azure ML Synapse 步驟的功能。

類別

AdlaStep

建立 Azure ML 管線步驟,以使用 Azure Data Lake Analytics執行 U-SQL 腳本。

如需使用此 AdlaStep 的範例,請參閱筆記本 https://aka.ms/pl-adla

建立 Azure ML 管線步驟,以使用 Azure Data Lake Analytics執行 U-SQL 腳本。

AutoMLStep

建立封裝自動化 ML 執行的 Azure ML 管線步驟。

如需使用 AutoMLStep 的範例,請參閱筆記本 https://aka.ms/pl-automl

初始化 AutoMLStep。

AutoMLStepRun

提供自動化 ML 實驗執行和擷取預設輸出方法的相關資訊。

AutoMLStepRun 類別可用來管理、檢查狀態,以及在管線中提交自動化 ML 執行後擷取執行詳細資料。 此外,這個類別可用來透過 StepRun 類別取得 的預設輸出 AutoMLStep

初始化 automl 步驟執行。

AzureBatchStep

建立 Azure ML 管線步驟,將作業提交至Azure Batch。

注意:此步驟不支援上傳/下載目錄及其內容。

如需使用 AzureBatchStep 的範例,請參閱筆記本 https://aka.ms/pl-azbatch

建立 Azure ML 管線步驟,將作業提交至Azure Batch。

CommandStep

建立執行命令的 Azure ML 管線步驟。

建立執行命令的 Azure ML 管線步驟。

DataTransferStep

建立 Azure ML 管線步驟,以在儲存體選項之間傳輸資料。

DataTransferStep 支援常見的儲存體類型,例如Azure Blob 儲存體和 Azure Data Lake 作為來源和接收器。 如需詳細資訊,請參閱一節。

如需使用 DataTransferStep 的範例,請參閱筆記本 https://aka.ms/pl-data-trans

建立 Azure ML 管線步驟,以在儲存體選項之間傳輸資料。

DatabricksStep

建立 Azure ML 管線步驟,以將 DataBricks 筆記本、Python 腳本或 JAR 新增為節點。

如需使用 DatabricksStep 的範例,請參閱筆記本 https://aka.ms/pl-databricks

建立 Azure ML 管線步驟,以將 DataBricks 筆記本、Python 腳本或 JAR 新增為節點。

如需使用 DatabricksStep 的範例,請參閱筆記本 https://aka.ms/pl-databricks

:p aram python_script_name:[必要] 相對於 的 Python 腳本 source_directory 名稱。 如果腳本接受輸入和輸出,這些會以參數的形式傳遞至腳本。 如果 python_script_name 已指定 ,則 source_directory 也必須指定 。

指定 、、 python_script_namemain_class_namenotebook_pathpython_script_path 其中一個 。

如果您將 DataReference 物件指定為 輸入,且具有 data_reference_name=input1 和 PipelineData 物件做為輸出 名稱=output1,則輸入和輸出會以參數的形式傳遞至腳本。 這是它們的外觀,您必須剖析腳本中的引數,以存取每個輸入和輸出的路徑: 「-input1」、「wasbs:///test」,「-output1」、「wasbs:// test@storagename.blob.core.windows.nettest@storagename.blob.core.windows.net /b3e26de1-87a4-494d-a20f-1988d2b81a2/output1」

此外,腳本中也會提供下列參數:

  • AZUREML_RUN_TOKEN:使用 Azure Machine Learning 進行驗證的 AML 權杖。
  • AZUREML_RUN_TOKEN_EXPIRY:AML 權杖到期時間。
  • AZUREML_RUN_ID:此回合的 Azure Machine Learning 執行識別碼。
  • AZUREML_ARM_SUBSCRIPTION:AML 工作區的 Azure 訂用帳戶。
  • AZUREML_ARM_RESOURCEGROUP:適用于 Azure Machine Learning 工作區的 Azure 資源群組。
  • AZUREML_ARM_WORKSPACE_NAME:Azure Machine Learning 工作區的名稱。
  • AZUREML_ARM_PROJECT_NAME:Azure Machine Learning 實驗的名稱。
  • AZUREML_SERVICE_ENDPOINT:AML 服務的端點 URL。
  • AZUREML_WORKSPACE_ID:Azure Machine Learning 工作區的識別碼。
  • AZUREML_EXPERIMENT_ID:Azure Machine Learning 實驗的識別碼。
  • AZUREML_SCRIPT_DIRECTORY_NAME:已複製source_directory之 DBFS 中的目錄路徑。
  (This parameter is only populated when `python_script_name` is used.  See more details below.)

當您使用 DatabricksStep 參數 source_directorypython_script_name Databricks 上的本機電腦上執行 Python 腳本時,您的source_directory會複製到 DBFS,而 DBFS 上的目錄路徑會在腳本開始執行時當做參數傳遞至腳本。 此參數會標示為 –AZUREML_SCRIPT_DIRECTORY_NAME。 您必須以字串 「dbfs:/」 作為前置詞或 「/dbfs/」 可存取 DBFS 中的目錄。

EstimatorStep

已淘汰。 建立管線步驟,以針對 Azure ML 模型定型執行 Estimator

建立 Azure ML 管線步驟,以執行機器學習模型定型的估算器。

已淘汰。 請改用 CommandStep 。 如需範例,請參閱 如何使用 CommandStep 在管線中執行 ML 訓練

HyperDriveStep

建立 Azure ML 管線步驟,以針對 Machine Learning 模型定型執行超參數微調。

如需使用 HyperDriveStep 的範例,請參閱筆記本 https://aka.ms/pl-hyperdrive

建立 Azure ML 管線步驟,以針對 Machine Learning 模型定型執行超參數微調。

HyperDriveStepRun

管理、檢查狀態,以及擷取管線步驟的執行 HyperDriveStep 詳細資料。

HyperDriveStepRun 提供 的功能 HyperDriveRun ,並提供 的額外支援 StepRun 。 HyperDriveStepRun 類別可讓您管理、檢查狀態,以及擷取 HyperDrive 執行及其每個產生的子執行的執行詳細資料。 一旦提交父管線執行,且管線已提交步驟執行,StepRun 類別可讓您執行此動作。

初始化 HyperDriveStepRun。

HyperDriveStepRun 提供 的功能 HyperDriveRun ,並提供 的額外支援 StepRun 。 HyperDriveRun 類別可讓您管理、檢查狀態,以及擷取 HyperDrive 執行及其每個產生的子執行的執行詳細資料。 一旦提交父管線執行,且管線已提交步驟執行,StepRun 類別可讓您執行此動作。

KustoStep

KustoStep 可讓您在 Azure ML Pipelines 中的目標 Kusto 叢集上執行 Kusto 查詢的功能。

初始化 KustoStep。

ModuleStep

建立 Azure Machine Learning 管線步驟,以執行特定版本的模組。

Module 物件會定義可重複使用的計算,例如腳本或可執行檔,可用於不同的機器學習案例和不同使用者。 若要在管線中使用模組的特定版本,請建立 ModuleStep。 ModuleStep 是管線中使用現有 ModuleVersion 的步驟。

如需使用 ModuleStep 的範例,請參閱筆記本 https://aka.ms/pl-modulestep

建立 Azure ML 管線步驟,以執行特定版本的模組。

MpiStep

建立 Azure ML 管線步驟以執行 MPI 作業。

如需使用 MpiStep 的範例,請參閱筆記本 https://aka.ms/pl-style-trans

建立 Azure ML 管線步驟以執行 MPI 作業。

已淘汰。 請改用 CommandStep 。 如需範例,請參閱 如何使用 CommandStep 在管線中執行分散式定型

ParallelRunConfig

定義 物件的組 ParallelRunStep 態。

如需使用 ParallelRunStep 的範例,請參閱筆記本 https://aka.ms/batch-inference-notebooks

如需疑難排解指南,請參閱 https://aka.ms/prstsg 。 您可以在該處找到更多參考。

初始化組態物件。

ParallelRunStep

建立 Azure Machine Learning 管線步驟,以非同步和平行方式處理大量資料。

如需使用 ParallelRunStep 的範例,請參閱筆記本 https://aka.ms/batch-inference-notebooks

如需疑難排解指南,請參閱 https://aka.ms/prstsg 。 您可以在該處找到更多參考。

建立 Azure ML 管線步驟,以非同步和平行方式處理大量資料。

如需使用 ParallelRunStep 的範例,請參閱筆記本連結 https://aka.ms/batch-inference-notebooks

PythonScriptStep

建立執行 Python 腳本的 Azure ML 管線步驟。

如需使用 PythonScriptStep 的範例,請參閱筆記本 https://aka.ms/pl-get-started

建立執行 Python 腳本的 Azure ML 管線步驟。

RScriptStep

注意

這是實驗性類別,可以隨時變更。 請參閱 https://aka.ms/azuremlexperimental 以取得詳細資訊。

建立執行 R 腳本的 Azure ML 管線步驟。

建立執行 R 腳本的 Azure ML 管線步驟。

已淘汰。 請改用 CommandStep 。 如需範例,請參閱 如何使用 CommandStep 在管線中執行 R 腳本

SynapseSparkStep

注意

這是實驗性類別,可以隨時變更。 請參閱 https://aka.ms/azuremlexperimental 以取得詳細資訊。

建立提交和執行 Python 腳本的 Azure ML Synapse 步驟。

建立在 synapse Spark 集區上執行 Spark 作業的 Azure ML 管線步驟。