steps 套件
包含可在 Azure Machine Learning 管線中執行的預先建置步驟。
Azure ML 管線步驟可以一起設定,以建構管線,其代表可共用且可重複使用的 Azure Machine Learning 工作流程。 如果步驟內容 (腳本和相依性) ,以及輸入和參數保持不變,管線的每個步驟都可以設定為允許重複使用其先前的執行結果。
此封裝中的類別通常會與封裝中的 core 類別搭配使用。 核心套件包含用來設定資料 (PipelineData) 、排程 () Schedule ,以及管理步驟 (StepRun) 輸出的類別。
此套件中預先建置的步驟涵蓋機器學習工作流程中遇到的許多常見案例。 若要開始使用預先建置的管線步驟,請參閱:
單元
adla_step |
包含使用 Azure Data Lake Analytics 執行 U-SQL 腳本的 Azure ML 管線步驟的功能。 |
automl_step |
包含在 Azure Machine Learning 中新增和管理自動化 ML 管線步驟的功能。 |
azurebatch_step |
包含在 Azure Batch 中執行 Windows 可執行檔的 Azure ML 管線步驟的功能。 |
command_step |
包含用來建立執行命令的 Azure ML 管線步驟的功能。 |
data_transfer_step |
包含建立 Azure ML 管線步驟的功能,可在儲存體選項之間傳輸資料。 |
databricks_step |
包含在 DBFS 上建立 Azure ML 管線步驟以執行 Databricks 筆記本或 Python 腳本的功能。 |
estimator_step |
包含建立管線步驟的功能,可執行 Machine Learning 模型定型的估算器。 |
hyper_drive_step |
包含用來建立和管理執行超參數微調之 Azure ML 管線步驟的有趣性。 |
kusto_step |
包含建立 Azure ML 管線步驟以執行 Kusto Notebook 的功能。 |
module_step |
包含使用現有模組版本新增 Azure Machine Learning 管線步驟的功能。 |
mpi_step |
包含新增 Azure ML 管線步驟以執行機器學習模型定型 MPI 作業的功能。 |
parallel_run_config |
包含設定 ParallelRunStep 的功能。 |
parallel_run_step |
包含可在多個 AmlCompute 目標上以平行模式執行使用者腳本的步驟。 |
python_script_step |
包含用來建立執行 Python 腳本的 Azure ML 管線步驟的功能。 |
r_script_step |
包含用來建立執行 R 腳本的 Azure ML 管線步驟的功能。 |
synapse_spark_step |
包含用來建立執行 Python 腳本的 Azure ML Synapse 步驟的功能。 |
類別
AdlaStep |
建立 Azure ML 管線步驟,以使用 Azure Data Lake Analytics執行 U-SQL 腳本。 如需使用此 AdlaStep 的範例,請參閱筆記本 https://aka.ms/pl-adla 。 建立 Azure ML 管線步驟,以使用 Azure Data Lake Analytics執行 U-SQL 腳本。 |
AutoMLStep |
建立封裝自動化 ML 執行的 Azure ML 管線步驟。 如需使用 AutoMLStep 的範例,請參閱筆記本 https://aka.ms/pl-automl 。 初始化 AutoMLStep。 |
AutoMLStepRun |
提供自動化 ML 實驗執行和擷取預設輸出方法的相關資訊。 AutoMLStepRun 類別可用來管理、檢查狀態,以及在管線中提交自動化 ML 執行後擷取執行詳細資料。 此外,這個類別可用來透過 StepRun 類別取得 的預設輸出 AutoMLStep 。 初始化 automl 步驟執行。 |
AzureBatchStep |
建立 Azure ML 管線步驟,將作業提交至Azure Batch。 注意:此步驟不支援上傳/下載目錄及其內容。 如需使用 AzureBatchStep 的範例,請參閱筆記本 https://aka.ms/pl-azbatch 。 建立 Azure ML 管線步驟,將作業提交至Azure Batch。 |
CommandStep |
建立執行命令的 Azure ML 管線步驟。 建立執行命令的 Azure ML 管線步驟。 |
DataTransferStep |
建立 Azure ML 管線步驟,以在儲存體選項之間傳輸資料。 DataTransferStep 支援常見的儲存體類型,例如Azure Blob 儲存體和 Azure Data Lake 作為來源和接收器。 如需詳細資訊,請參閱一節。 如需使用 DataTransferStep 的範例,請參閱筆記本 https://aka.ms/pl-data-trans 。 建立 Azure ML 管線步驟,以在儲存體選項之間傳輸資料。 |
DatabricksStep |
建立 Azure ML 管線步驟,以將 DataBricks 筆記本、Python 腳本或 JAR 新增為節點。 如需使用 DatabricksStep 的範例,請參閱筆記本 https://aka.ms/pl-databricks 。 建立 Azure ML 管線步驟,以將 DataBricks 筆記本、Python 腳本或 JAR 新增為節點。 如需使用 DatabricksStep 的範例,請參閱筆記本 https://aka.ms/pl-databricks 。 :p aram python_script_name:[必要] 相對於 的 Python 腳本 指定 、、 如果您將 DataReference 物件指定為 輸入,且具有 data_reference_name=input1 和 PipelineData 物件做為輸出 名稱=output1,則輸入和輸出會以參數的形式傳遞至腳本。 這是它們的外觀,您必須剖析腳本中的引數,以存取每個輸入和輸出的路徑: 「-input1」、「wasbs:///test」,「-output1」、「wasbs:// test@storagename.blob.core.windows.nettest@storagename.blob.core.windows.net /b3e26de1-87a4-494d-a20f-1988d2b81a2/output1」 此外,腳本中也會提供下列參數:
當您使用 DatabricksStep 參數 |
EstimatorStep |
已淘汰。 建立管線步驟,以針對 Azure ML 模型定型執行 Estimator 。 建立 Azure ML 管線步驟,以執行機器學習模型定型的估算器。 已淘汰。 請改用 CommandStep 。 如需範例,請參閱 如何使用 CommandStep 在管線中執行 ML 訓練。 |
HyperDriveStep |
建立 Azure ML 管線步驟,以針對 Machine Learning 模型定型執行超參數微調。 如需使用 HyperDriveStep 的範例,請參閱筆記本 https://aka.ms/pl-hyperdrive 。 建立 Azure ML 管線步驟,以針對 Machine Learning 模型定型執行超參數微調。 |
HyperDriveStepRun |
管理、檢查狀態,以及擷取管線步驟的執行 HyperDriveStep 詳細資料。 HyperDriveStepRun 提供 的功能 HyperDriveRun ,並提供 的額外支援 StepRun 。 HyperDriveStepRun 類別可讓您管理、檢查狀態,以及擷取 HyperDrive 執行及其每個產生的子執行的執行詳細資料。 一旦提交父管線執行,且管線已提交步驟執行,StepRun 類別可讓您執行此動作。 初始化 HyperDriveStepRun。 HyperDriveStepRun 提供 的功能 HyperDriveRun ,並提供 的額外支援 StepRun 。 HyperDriveRun 類別可讓您管理、檢查狀態,以及擷取 HyperDrive 執行及其每個產生的子執行的執行詳細資料。 一旦提交父管線執行,且管線已提交步驟執行,StepRun 類別可讓您執行此動作。 |
KustoStep |
KustoStep 可讓您在 Azure ML Pipelines 中的目標 Kusto 叢集上執行 Kusto 查詢的功能。 初始化 KustoStep。 |
ModuleStep |
建立 Azure Machine Learning 管線步驟,以執行特定版本的模組。 Module 物件會定義可重複使用的計算,例如腳本或可執行檔,可用於不同的機器學習案例和不同使用者。 若要在管線中使用模組的特定版本,請建立 ModuleStep。 ModuleStep 是管線中使用現有 ModuleVersion 的步驟。 如需使用 ModuleStep 的範例,請參閱筆記本 https://aka.ms/pl-modulestep 。 建立 Azure ML 管線步驟,以執行特定版本的模組。 |
MpiStep |
建立 Azure ML 管線步驟以執行 MPI 作業。 如需使用 MpiStep 的範例,請參閱筆記本 https://aka.ms/pl-style-trans 。 建立 Azure ML 管線步驟以執行 MPI 作業。 已淘汰。 請改用 CommandStep 。 如需範例,請參閱 如何使用 CommandStep 在管線中執行分散式定型。 |
ParallelRunConfig |
定義 物件的組 ParallelRunStep 態。 如需使用 ParallelRunStep 的範例,請參閱筆記本 https://aka.ms/batch-inference-notebooks 。 如需疑難排解指南,請參閱 https://aka.ms/prstsg 。 您可以在該處找到更多參考。 初始化組態物件。 |
ParallelRunStep |
建立 Azure Machine Learning 管線步驟,以非同步和平行方式處理大量資料。 如需使用 ParallelRunStep 的範例,請參閱筆記本 https://aka.ms/batch-inference-notebooks 。 如需疑難排解指南,請參閱 https://aka.ms/prstsg 。 您可以在該處找到更多參考。 建立 Azure ML 管線步驟,以非同步和平行方式處理大量資料。 如需使用 ParallelRunStep 的範例,請參閱筆記本連結 https://aka.ms/batch-inference-notebooks 。 |
PythonScriptStep |
建立執行 Python 腳本的 Azure ML 管線步驟。 如需使用 PythonScriptStep 的範例,請參閱筆記本 https://aka.ms/pl-get-started 。 建立執行 Python 腳本的 Azure ML 管線步驟。 |
RScriptStep |
注意 這是實驗性類別,可以隨時變更。 請參閱 https://aka.ms/azuremlexperimental 以取得詳細資訊。 建立執行 R 腳本的 Azure ML 管線步驟。 建立執行 R 腳本的 Azure ML 管線步驟。 已淘汰。 請改用 CommandStep 。 如需範例,請參閱 如何使用 CommandStep 在管線中執行 R 腳本。 |
SynapseSparkStep |
注意 這是實驗性類別,可以隨時變更。 請參閱 https://aka.ms/azuremlexperimental 以取得詳細資訊。 建立提交和執行 Python 腳本的 Azure ML Synapse 步驟。 建立在 synapse Spark 集區上執行 Spark 作業的 Azure ML 管線步驟。 |