OutputPortBinding 클래스

파이프라인 단계의 명명된 출력을 정의합니다.

OutputPortBinding을 사용하여 한 단계에서 생성할 데이터의 형식과 데이터 생성 방법을 지정할 수 있습니다. 단계 출력이 다른 단계의 필수 입력임을 지정하는 데 사용할 InputPortBinding 수 있습니다.

OutputPortBinding을 초기화합니다.

생성자

OutputPortBinding(name, datastore=None, output_name=None, bind_mode='mount', path_on_compute=None, is_directory=None, overwrite=None, data_type=None, pipeline_output_name=None, training_output=None, dataset_registration=None, dataset_output=None)

매개 변수

Name	Description
name 필수	str 문자, 숫자 및 밑줄만 포함할 수 있는 OutputPortBinding 개체의 이름입니다.
datastore	Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore] PipelineData가 상주하는 데이터 저장소입니다. Default value: None
output_name	str 없음 이름을 사용하는 경우 출력의 이름입니다. 문자, 숫자 및 밑줄만 포함할 수 있습니다. Default value: None
bind_mode	str 생성 단계에서 "upload" 또는 "mount" 또는 "hdfs" 메서드를 사용하여 데이터에 액세스할지 여부를 지정합니다. Default value: mount
path_on_compute	str "업로드" 모드의 경우 모듈이 출력을 쓰는 경로입니다. Default value: None
is_directory	bool 출력이 디렉터리인지 단일 파일인지 여부입니다. Default value: None
overwrite	bool "업로드" 모드의 경우 기존 데이터를 덮어쓸지 여부입니다. Default value: None
data_type	str 선택 사항입니다. 데이터 형식을 사용하여 예상 출력 형식을 지정하고 소비 단계에서 데이터를 사용하는 방법을 자세히 설명할 수 있습니다. 사용자 정의 문자열일 수 있습니다. Default value: None
pipeline_output_name	str 제공된 경우 이 출력은 PipelineRun.get_pipeline_output()를 사용하여 사용할 수 있습니다. 파이프라인 출력 이름은 파이프라인에서 고유해야 합니다. Default value: None
training_output	TrainingOutput 학습 결과에 대한 출력을 정의합니다. 메트릭 및 모델과 같은 다양한 종류의 출력을 생성하는 특정 학습에만 필요합니다. 예를 들어 AutoMLStep 메트릭과 모델이 생성됩니다. 최상의 모델을 가져오는 데 사용되는 특정 학습 반복 또는 메트릭을 정의할 수도 있습니다. 따라서 HyperDriveStep출력에 포함할 특정 모델 파일을 정의할 수도 있습니다. Default value: None
dataset_registration	DatasetRegistration 선택 사항입니다. 내부 매개 변수입니다. 대신 PipelineData.as_dataset 사용해야 합니다. Default value: None
dataset_output	OutputDatasetConfig 선택 사항입니다. 내부 매개 변수입니다. OutputFileDatasetConfig intead를 사용해야 합니다. Default value: None
name 필수	str 문자, 숫자 및 밑줄만 포함할 수 있는 OutputPortBinding 개체의 이름입니다.
datastore 필수	Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore] PipelineData가 상주하는 데이터 저장소입니다.
output_name 필수	str 없음 이름을 사용하는 경우 출력의 이름입니다. 문자, 숫자 및 밑줄만 포함할 수 있습니다.
bind_mode 필수	str 생성 단계에서 "upload" 또는 "mount" 또는 "hdfs" 메서드를 사용하여 데이터에 액세스할지 여부를 지정합니다.
path_on_compute 필수	str "업로드" 모드의 경우 모듈이 출력을 쓰는 경로입니다.
is_directory 필수	bool 출력이 디렉터리인 경우
overwrite 필수	bool "업로드" 모드의 경우 기존 데이터를 덮어쓸지 여부입니다.
data_type 필수	str 선택 사항입니다. 데이터 형식을 사용하여 예상 출력 형식을 지정하고 소비 단계에서 데이터를 사용하는 방법을 자세히 설명할 수 있습니다. 사용자 정의 문자열일 수 있습니다.
pipeline_output_name 필수	str 제공된 경우 이 출력은 PipelineRun.get_pipeline_output()를 사용하여 사용할 수 있습니다. 파이프라인 출력 이름은 파이프라인에서 고유해야 합니다.
training_output 필수	TrainingOutput 학습 결과에 대한 출력을 정의합니다. 메트릭 및 모델과 같은 다양한 종류의 출력을 생성하는 특정 학습에만 필요합니다. 예를 들어 AutoMLStep 메트릭과 모델이 생성됩니다. 최상의 모델을 가져오는 데 사용되는 특정 학습 반복 또는 메트릭을 정의할 수도 있습니다. 따라서 HyperDriveStep출력에 포함할 특정 모델 파일을 정의할 수도 있습니다.
dataset_registration 필수	DatasetRegistration 선택 사항입니다. 내부 매개 변수입니다. 대신 PipelineData.as_dataset 사용해야 합니다.
dataset_output 필수	OutputDatasetConfig 선택 사항입니다. 내부 매개 변수입니다. OutputFileDatasetConfig intead를 사용해야 합니다.

설명

OutputPortBinding은 파이프라인을 빌드하여 단계 입력 및 출력을 지정할 때와 비슷한 방식으로 PipelineData 사용할 수 있습니다. 차이점은 OutputPortBinding을 다른 단계에 대한 입력으로 사용하려면 사용해야 InputPortBinding 한다는 것입니다.

OutputPortBinding을 사용하여 파이프라인을 생성하는 예제는 다음과 같습니다.


   from azureml.pipeline.core import OutputPortBinding, InputPortBinding, Pipeline
   from azureml.pipeline.steps import PythonScriptStep

   step_1_output = OutputPortBinding("output", datastore=datastore)

   step_1 = PythonScriptStep(
       name='process data',
       script_name="process_data.py",
       compute_target=compute,
       arguments=["--output", step_1_output],
       outputs=[step_1_output]
   )

   step_2_input = InputPortBinding("input", bind_object=step_1_output)

   step_2 = PythonScriptStep(
       name='train',
       script_name="train.py",
       compute_target=compute,
       arguments=["--input", step_2_input],
       inputs=[step_2_input]
   )

   pipeline = Pipeline(workspace=workspace, steps=[step_1, step_2])

이렇게 하면 두 단계로 파이프라인이 생성됩니다. 프로세스 단계가 먼저 실행된 다음, 완료된 후 학습 단계가 실행됩니다. Azure ML은 OutputPortBinding 개체에 설명된 대로 프로세스 단계에서 생성된 출력을 학습 단계에 제공합니다.

특성

bind_mode

생성 단계에서 데이터를 만드는 데 사용할 모드("업로드" 또는 "탑재" 또는 "hdfs")를 가져옵니다.

반환

형식	Description
str	바인딩 모드입니다.

data_type

생성될 데이터 형식을 가져옵니다.

반환

형식	Description
str	데이터 형식 이름입니다.

dataset_registration

데이터 세트 등록 정보를 가져옵니다.

반환

형식	Description
DatasetRegistration	데이터 세트 등록 정보입니다.

datastore

PipelineData가 상주하는 데이터 저장소입니다.

반환

형식	Description
Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]	Datastore 개체입니다.

is_directory

출력이 디렉터리인지 여부입니다.

반환

형식	Description
bool	is_directory

name

OutputPortBinding 개체의 이름입니다.

반환

형식	Description
str	이름입니다.

overwrite

"업로드" 모드의 경우 기존 데이터를 덮어쓸지 여부를 나타냅니다.

반환

형식	Description
bool	_덮어쓸

path_on_compute

"업로드" 모드의 경우 모듈이 출력을 쓰는 경로입니다.

반환

형식	Description
str	path_on_compute

pipeline_output_name

이 OutputPortBinding에 해당하는 파이프라인 출력의 이름을 가져옵니다.

반환

형식	Description
str	파이프라인 출력 이름입니다.

training_output

학습 출력을 가져옵니다.

반환

형식	Description
TrainingOutput	학습 출력

피드백

이 페이지가 도움이 되었나요?