builder 模組

定義用來建置 Azure Machine Learning 管線的類別。

管線圖形是由管線步驟所組成, () PipelineStep 、選擇性管線數據 (PipelineData) 在每個步驟中產生或取用,以及選擇性的步驟執行順序 (StepSequence) 。

類別

PipelineData

代表 Azure Machine Learning 管線中的元數據。

管線中使用的數據可由一個步驟產生,另一個步驟是提供 PipelineData 物件做為一個步驟的輸出,以及一或多個後續步驟的輸入。

請注意 ,如果您使用管線數據,請確定所使用的目錄已存在。

若要確保目錄存在,Python 範例假設您在一個管線步驟中有名為 output_folder 的輸出埠,您想要將此資料夾中的一些數據寫入相對路徑。


   import os
   os.makedirs(args.output_folder, exist_ok=True)
   f = open(args.output_folder + '/relative_path/file_name', 'w+')

PipelineData 會使用不再建議的數據存取和傳遞方法 DataReference 基礎,請改用 OutputFileDatasetConfig ,您可以在這裡找到範例: 使用 OutputFileDatasetConfig 的管線

初始化 PipelineData。

PipelineStep

代表 Azure Machine Learning 管線中的執行步驟。

管線是由多個管線步驟所建構,這些步驟是管線中的不同計算單位。 每個步驟都可以獨立執行,並使用隔離的計算資源。 每個步驟通常都有自己的具名輸入、輸出和參數。

PipelineStep 類別是基類,其他專為常見案例所設計之內建步驟類別繼承的基類,例如 PythonScriptStepDataTransferStepHyperDriveStep

如需管線和 PipelineSteps 相關概觀,請參閱 什麼是 ML 管線

初始化 PipelineStep。

StepSequence

代表 中的 Pipeline 步驟清單,以及執行步驟的順序。

初始化管線時,請使用 StepSequence 來建立包含特定順序執行步驟的工作流程。

初始化 StepSequence。