builder 모듈

Azure Machine Learning 파이프라인을 빌드하기 위한 클래스를 정의합니다.

파이프라인 그래프는 파이프라인 단계(PipelineStep), 각 단계에서 생성되거나 이용되는 선택적 파이프라인 데이터(PipelineData), 선택적 단계 실행 시퀀스(StepSequence)로 구성됩니다.

클래스

PipelineData

Azure Machine Learning 파이프라인의 중간 데이터를 나타냅니다.

파이프라인에서 사용되는 데이터는 한 단계의 출력과 하나 이상 후속 단계의 입력으로 PipelineData 개체를 제공하여 한 단계에서 생성하고 다른 단계에서 이용할 수 있습니다.

참고 파이프라인 데이터를 사용하는 경우 사용된 디렉터리가 있는지 확인하세요.

디렉터리가 있는지 확인하는 Python 예제입니다. 한 파이프라인 단계에서 output_folder라는 출력 포트가 있다고 가정하고 이 폴더의 상대 경로에 일부 데이터를 쓰려고 합니다.


   import os
   os.makedirs(args.output_folder, exist_ok=True)
   f = open(args.output_folder + '/relative_path/file_name', 'w+')

PipelineData는 데이터 액세스 및 배달에 더 이상 권장되지 않는 접근 방식인 기본 DataReference를 사용합니다. OutputFileDatasetConfig를 대신 사용하세요. OutputFileDatasetConfig를 사용하는 파이프라인에서 샘플을 확인할 수 있습니다.

PipelineData를 초기화합니다.

PipelineStep

Azure Machine Learning 파이프라인의 실행 단계를 나타냅니다.

파이프라인은 파이프라인의 고유한 계산 단위인 여러 파이프라인 단계로 구성됩니다. 각 단계는 독립적으로 실행되어 격리된 컴퓨팅 리소스를 사용할 수 있습니다. 각 단계에는 일반적으로 이름이 지정된 고유한 입력, 출력, 매개 변수가 있습니다.

PipelineStep 클래스는 PythonScriptStep, DataTransferStep, HyperDriveStep과 같은 일반적인 시나리오용으로 설계된 다른 기본 제공 단계 클래스가 상속되는 기본 클래스입니다.

Pipelines와 PipelineSteps의 관계에 대한 개요는 What are ML Pipelines(ML 파이프라인이란?)를 참조하세요.

PipelineStep을 초기화합니다.

StepSequence

Pipeline의 단계 목록과 그러한 단계를 실행할 순서를 나타냅니다.

파이프라인을 초기화할 때 StepSequence를 사용하여 특정 순서로 실행할 단계가 포함된 워크플로를 생성합니다.

StepSequence를 초기화합니다.