共用方式為


AutoMLStep 類別

建立封裝自動化 ML 執行的 Azure ML 管線步驟。

如需使用 AutoMLStep 的範例,請參閱筆記本 https://aka.ms/pl-automl

初始化 AutoMLStep。

繼承
AutoMLStep

建構函式

AutoMLStep(name, automl_config, inputs=None, outputs=None, script_repl_params=None, allow_reuse=True, version=None, hash_paths=None, enable_default_model_output=True, enable_default_metrics_output=True, **kwargs)

參數

name
str
必要

步驟的名稱。

automl_config
AutoMLConfig
必要

AutoMLConfig 物件,定義這個 AutoML 執行的組態。

inputs
list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData]]
預設值: None

輸入埠系結的清單。

outputs
list[Union[PipelineData, OutputPortBinding]]
預設值: None

輸出埠系結的清單。

script_repl_params
dict
預設值: None

腳本中要取代的選擇性參數,例如 {'param1': 'value1', 'param2': 'value2'}。

allow_reuse
bool
預設值: True

指出當使用相同的設定重新執行時,此步驟是否應該重複使用先前的結果。

預設會啟用重複使用。 如果步驟內容 (腳本/相依性) 以及輸入和參數保持不變,則會重複使用此步驟上一次執行的輸出。 重複使用步驟時,不會提交要計算的作業,而是立即提供給任何後續步驟使用上一次執行的結果。 如果您使用 Azure Machine Learning 資料集作為輸入,重複使用取決於資料集的定義是否已變更,而不是基礎資料是否已變更。

version
str
預設值: None

要指派給步驟的版本。

hash_paths
list
預設值: None

已淘汰。 檢查管線步驟內容的變更時,雜湊的路徑清單。

根據預設,中 參數下 path 的所有檔案都會雜湊,但 .amlignore 或 .gitignore 中所列的檔案除外 pathAutoMLConfig 如果未偵測到任何變更,管線會重複使用上一次執行的步驟內容。

enable_default_model_output
bool
預設值: True

指出是否將最佳模型新增為預設輸出。 這可用來在使用 類別完成 AutoMLStepRun 執行之後擷取最佳模型。 請注意,如果不需要預設模型輸出,建議將此參數設定為 False

enable_default_metrics_output
bool
預設值: True

指出是否所有子執行計量都會新增為預設輸出。 這可用來在使用 類別完成 AutoMLStepRun 執行之後擷取子執行計量。 請注意,如果不需要預設計量輸出,建議將此參數設定為 False

name
str
必要

步驟的名稱。

automl_config
AutoMLConfig
必要

AutoMLConfig,定義這個 AutoML 執行的組態。

inputs
list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData]]
必要

輸入埠系結的清單。

outputs
list[Union[PipelineData, OutputPortBinding]]
必要

輸出埠系結的清單。

script_repl_params
dict
必要

腳本中要取代的選擇性參數,例如 {'param1': 'value1', 'param2': 'value2'}。

script_repl_params
必要

要在腳本中取代的選擇性參數。

allow_reuse
bool
必要

指出當使用相同的設定重新執行時,此步驟是否應該重複使用先前的結果。

預設會啟用重複使用。 如果步驟內容 (腳本/相依性) 以及輸入和參數保持不變,則會重複使用此步驟上一次執行的輸出。 重複使用步驟時,不會提交要計算的作業,而是立即提供給任何後續步驟使用上一次執行的結果。 如果您使用 Azure Machine Learning 資料集作為輸入,重複使用取決於資料集的定義是否已變更,而不是基礎資料是否已變更。

version
str
必要

要指派給步驟的版本。

hash_paths
list
必要

已淘汰。 檢查管線步驟內容的變更時,雜湊的路徑清單。

根據預設,中 參數下 path 的所有檔案都會雜湊,但 .amlignore 或 .gitignore 中所列的檔案除外 pathAutoMLConfig 如果未偵測到任何變更,管線會重複使用上一次執行的步驟內容。

enable_default_model_output
bool
必要

指出是否將最佳模型新增為預設輸出。 這可用來在使用 類別完成 AutoMLStepRun 執行之後擷取最佳模型。 請注意,如果不需要預設模型輸出,建議將此參數設定為 False

enable_default_metrics_output
bool
必要

指出是否所有子執行計量都會新增為預設輸出。 這可用來在使用 類別完成 AutoMLStepRun 執行之後擷取子執行計量。 請注意,如果不需要預設計量輸出,建議將此參數設定為 False

備註

透過 AutoMLStep 類別,您可以在 Azure Machine Learning 管線中執行自動化 ML 工作流程。 管線可為自動化 ML 工作流程提供重複性、自動執行、版本設定和追蹤,以及模組化等優點。 如需詳細資訊,請參閱 什麼是 Azure Machine Learning 管線?

當您的自動化 ML 工作流程位於管線中時,您可以排程管線以時間為基礎的排程或變更型排程來執行。 以時間為基礎的排程適用于監視資料漂移等例行工作,而變更型排程適用于異常或無法預測的變更,例如資料變更時。 例如,您的排程可能會輪詢正在上傳資料的 Blob 存放區,然後在資料變更後再次執行管線,然後在執行完成後註冊新版本的模型。 如需詳細資訊,請參閱 排程機器學習管線從邏輯應用程式觸發 Machine Learning 管線的執行

下列範例示範如何建立 AutoMLStep。


   automl_step = AutoMLStep(
       name='automl_module',
       automl_config=automl_config,
       outputs=[metrics_data, model_data],
       allow_reuse=True)

完整範例可從 https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb

下列範例示範如何在 中使用 Pipeline AutoMLStep 物件。


   from azureml.pipeline.core import Pipeline
   pipeline = Pipeline(
       description="pipeline_with_automlstep",
       workspace=ws,
       steps=[automl_step])

完整範例可從 https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb

上述範例顯示管線中的一個步驟。 不過,在真實世界的自動化 ML 工作流程中使用 AutoMLStep 時,您至少有一個管線步驟會在 AutoMLStep 之前執行資料準備,並在該步驟之後執行另一個管線步驟來註冊模型。 如需這類工作流程的範例,請參閱筆記本 https://aka.ms/automl-retrain-pipeline

若要管理、檢查狀態,以及從管線執行取得執行詳細資料,請使用 AutoMLStepRun 類別。

如需 Azure 中自動化機器學習的詳細資訊,請參閱 什麼是自動化機器學習一文?。 如需在沒有使用管線的情況下設定自動化 ML 實驗的詳細資訊,請參閱 在 Python 中設定自動化 ML 實驗一文。

方法

create_node

從這個 AutoML 步驟建立節點,並將 新增至指定的圖形。

這個方法不適合直接使用。 使用此步驟具現化管線時,Azure ML 會自動傳遞透過此方法所需的參數,以便將步驟新增至代表工作流程的管線圖形。

create_node

從這個 AutoML 步驟建立節點,並將 新增至指定的圖形。

這個方法不適合直接使用。 使用此步驟具現化管線時,Azure ML 會自動傳遞透過此方法所需的參數,以便將步驟新增至代表工作流程的管線圖形。

create_node(graph, default_datastore, context)

參數

graph
Graph
必要

要加入節點的繪圖物件。

default_datastore
Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]
必要

預設資料存放區。

context
<xref:azureml.pipeline.core._GraphContext>
必要

圖形內容。

傳回

已建立的節點。

傳回類型

屬性

AUTOML_CONFIG_PARAM_NAME

AUTOML_CONFIG_PARAM_NAME = 'AutoMLConfig'

DEFAULT_METRIC_PREFIX

DEFAULT_METRIC_PREFIX = 'default_metrics_'

DEFAULT_MODEL_PREFIX

DEFAULT_MODEL_PREFIX = 'default_model_'