EstimatorStep 類別
已淘汰。 建立要 Estimator 針對 Azure ML 模型定型執行的管線步驟。
建立 Azure ML 管線步驟,以執行 Machine Learning 模型定型的估算器。
已淘汰。 CommandStep請改用 。 如需範例,請參閱 如何使用 CommandStep 在管線中執行 ML 定型。
- 繼承
-
EstimatorStep
建構函式
EstimatorStep(name=None, estimator=None, estimator_entry_script_arguments=None, runconfig_pipeline_params=None, inputs=None, outputs=None, compute_target=None, allow_reuse=True, version=None)
參數
名稱 | Description |
---|---|
name
|
步驟的名稱。 預設值: None
|
estimator
|
此步驟的相關估算器物件。 可以是預先設定的估算器,例如 Chainer 、 PyTorch 、 TensorFlow 或 SKLearn 。 預設值: None
|
estimator_entry_script_arguments
|
[必要]命令列引數的清單。 如果估算器的專案腳本不接受命令列引數,請將此參數值設定為空白清單。 預設值: None
|
runconfig_pipeline_params
|
使用機碼/值組在執行時間覆寫 Runconfig 屬性,每個屬性都有 Runconfig 屬性的名稱和該屬性的 PipelineParameter。 支援的值:'NodeCount'、'MpiProcessCountPerNode'、'TensorflowWorkerCount'、'TensorflowParameterServerCount' 預設值: None
|
inputs
|
要使用的輸入清單。 預設值: None
|
outputs
|
PipelineData 物件的清單。 預設值: None
|
compute_target
|
[必要]要使用的計算目標。 預設值: None
|
allow_reuse
|
指出當使用相同的設定重新執行時,步驟是否應該重複使用先前的結果。 預設會啟用重複使用。 如果步驟內容 (腳本/相依性) ,以及輸入和參數保持不變,則會重複使用此步驟上一次執行的輸出。 重複使用步驟時,不會提交要計算的作業,則會立即讓任何後續步驟使用上一次執行的結果。 如果您使用 Azure Machine Learning 資料集做為輸入,則重複使用取決於資料集的定義是否已變更,而非基礎資料是否已變更。 預設值: True
|
version
|
選擇性版本標籤,表示模組功能變更。 預設值: None
|
name
必要
|
步驟的名稱。 |
estimator
必要
|
<xref:Estimator>
此步驟的相關估算器物件。 可以是預先設定的估算器,例如 Chainer 、 PyTorch 、 TensorFlow 或 SKLearn 。 |
estimator_entry_script_arguments
必要
|
[str]
[必要]命令列引數的清單。 如果估算器的專案腳本不接受命令列引數,請將此參數值設定為空白清單。 |
runconfig_pipeline_params
必要
|
使用機碼/值組在執行時間覆寫 Runconfig 屬性,每個屬性都有 Runconfig 屬性的名稱和該屬性的 PipelineParameter。 支援的值:'NodeCount'、'MpiProcessCountPerNode'、'TensorflowWorkerCount'、'TensorflowParameterServerCount' |
inputs
必要
|
list[Union[PipelineData, PipelineOutputAbstractDataset, DataReference, DatasetConsumptionConfig, PipelineOutputTabularDataset, PipelineOutputFileDataset]]
要使用的輸入清單。 |
outputs
必要
|
PipelineData 物件的清單。 |
compute_target
必要
|
[必要]要使用的計算目標。 |
allow_reuse
必要
|
指出當使用相同的設定重新執行時,步驟是否應該重複使用先前的結果。 預設會啟用重複使用。 如果步驟內容 (腳本/相依性) ,以及輸入和參數保持不變,則會重複使用此步驟上一次執行的輸出。 重複使用步驟時,不會提交要計算的作業,則會立即讓任何後續步驟使用上一次執行的結果。 如果您使用 Azure Machine Learning 資料集做為輸入,則重複使用取決於資料集的定義是否已變更,而非基礎資料是否已變更。 |
version
必要
|
version |
備註
請注意,具現化 EstimatorStep 時,必須使用 參數指定 物件中使用的 Estimator 專案腳本引數做為 清單estimator_entry_script_arguments
。 估算器參數 script_params
接受字典。 不過, estimator_entry_script_argument
參數預期引數為清單。
EstimatorStep 初始化牽涉到使用 參數指定輸入 inputs
清單,而且您不需要使用估算器指定輸入,如果您這麼做,將會擲回例外狀況。 如需允許的輸入類型,請參閱 inputs
參數。 您也可以選擇性地指定步驟的任何輸出。 如需允許的輸出類型,請參閱 outputs
參數。
使用 EstimatorStep 的最佳做法是針對腳本和與步驟相關聯的任何相依檔案使用不同的資料夾,並將該資料夾指定為 Estimator 物件的 source_directory
。 這麼做有兩個優點。 首先,它有助於減少為步驟建立的快照集大小,因為只會快照集步驟所需的專案。 其次,如果沒有任何變更 source_directory
會觸發 snaphot 重新上傳的 ,則可以重複使用先前執行的步驟輸出。
方法
create_node |
從估算器步驟建立節點,並將它新增至指定的圖表。 已淘汰。 CommandStep請改用 。 如需範例,請參閱 如何使用 CommandStep 在管線中執行 ML 定型。 這個方法不適合直接使用。 使用此步驟具現化管線時,Azure ML 會自動傳遞透過此方法所需的參數,以便將步驟新增至代表工作流程的管線圖形。 |
create_node
從估算器步驟建立節點,並將它新增至指定的圖表。
已淘汰。 CommandStep請改用 。 如需範例,請參閱 如何使用 CommandStep 在管線中執行 ML 定型。
這個方法不適合直接使用。 使用此步驟具現化管線時,Azure ML 會自動傳遞透過此方法所需的參數,以便將步驟新增至代表工作流程的管線圖形。
create_node(graph, default_datastore, context)
參數
名稱 | Description |
---|---|
graph
必要
|
要加入節點的繪圖物件。 |
default_datastore
必要
|
預設資料存放區。 |
context
必要
|
<xref:azureml.pipeline.core._GraphContext>
圖形內容。 |
傳回
類型 | Description |
---|---|
已建立的節點。 |