OutputPortBinding 클래스

파이프라인 단계의 명명된 출력을 정의합니다.

OutputPortBinding을 사용하여 한 단계에서 생성할 데이터의 형식과 데이터를 생성하는 방법을 지정할 수 있습니다. InputPortBinding과 함께 사용하여 단계 출력이 다른 단계의 필수 입력임을 지정할 수 있습니다.

OutputPortBinding을 초기화합니다.

상속
builtins.object
OutputPortBinding

생성자

OutputPortBinding(name, datastore=None, output_name=None, bind_mode='mount', path_on_compute=None, is_directory=None, overwrite=None, data_type=None, pipeline_output_name=None, training_output=None, dataset_registration=None, dataset_output=None)

매개 변수

name
str
필수

문자, 숫자 및 밑줄만 포함할 수 있는 OutputPortBinding 개체의 이름입니다.

datastore
Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]
기본값: None

PipelineData가 상주할 데이터 저장소입니다.

output_name
str
기본값: None

None 이름이 사용되는 경우 출력의 이름입니다. 문자, 숫자 및 밑줄만 포함할 수 있습니다.

bind_mode
str
기본값: mount

생성 단계에서 "upload" 또는 "mount" 또는 "hdfs" 메서드를 사용하여 데이터에 액세스할지 여부를 지정합니다.

path_on_compute
str
기본값: None

"upload" 모드의 경우 모듈이 출력을 쓰는 경로입니다.

is_directory
bool
기본값: None

출력이 디렉터리인지 아니면 단일 파일인지 나타냅니다.

overwrite
bool
기본값: None

"upload" 모드의 경우 기존 데이터를 덮어쓸지 여부를 나타냅니다.

data_type
str
기본값: None

선택 사항입니다. 데이터 형식을 사용하여 예상되는 출력 유형을 지정하고 소비 단계에서 데이터를 사용하는 방법을 자세히 설명할 수 있습니다. 모든 사용자 정의 문자열이 될 수 있습니다.

pipeline_output_name
str
기본값: None

제공될 경우 이 출력은 PipelineRun.get_pipeline_output()을 사용하여 이용할 수 있습니다. 파이프라인 출력 이름은 파이프라인에서 고유해야 합니다.

training_output
TrainingOutput
기본값: None

학습 결과에 대한 출력을 정의합니다. 이는 메트릭 및 모델과 같은 다양한 종류의 출력을 생성하는 특정 학습에만 필요합니다. 예를 들어 AutoMLStep은 메트릭 및 모델을 생성합니다. 최상의 모델을 얻는 데 사용되는 특정 학습 반복 또는 메트릭을 정의할 수도 있습니다. HyperDriveStep의 경우 출력에 포함할 특정 모델 파일을 정의할 수도 있습니다.

dataset_registration
DatasetRegistration
기본값: None

선택 사항입니다. 내부 매개 변수입니다. PipelineData.as_dataset을 대신 사용해야 합니다.

dataset_output
OutputDatasetConfig
기본값: None

선택 사항입니다. 내부 매개 변수입니다. OutputFileDatasetConfig를 대신 사용해야 합니다.

name
str
필수

문자, 숫자 및 밑줄만 포함할 수 있는 OutputPortBinding 개체의 이름입니다.

datastore
Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]
필수

PipelineData가 상주할 데이터 저장소입니다.

output_name
str
필수

None 이름이 사용되는 경우 출력의 이름입니다. 문자, 숫자 및 밑줄만 포함할 수 있습니다.

bind_mode
str
필수

생성 단계에서 "upload" 또는 "mount" 또는 "hdfs" 메서드를 사용하여 데이터에 액세스할지 여부를 지정합니다.

path_on_compute
str
필수

"upload" 모드의 경우 모듈이 출력을 쓰는 경로입니다.

is_directory
bool
필수

출력이 디렉터리인 경우

overwrite
bool
필수

"upload" 모드의 경우 기존 데이터를 덮어쓸지 여부를 나타냅니다.

data_type
str
필수

선택 사항입니다. 데이터 형식을 사용하여 예상되는 출력 유형을 지정하고 소비 단계에서 데이터를 사용하는 방법을 자세히 설명할 수 있습니다. 모든 사용자 정의 문자열이 될 수 있습니다.

pipeline_output_name
str
필수

제공될 경우 이 출력은 PipelineRun.get_pipeline_output()을 사용하여 이용할 수 있습니다. 파이프라인 출력 이름은 파이프라인에서 고유해야 합니다.

training_output
TrainingOutput
필수

학습 결과에 대한 출력을 정의합니다. 이는 메트릭 및 모델과 같은 다양한 종류의 출력을 생성하는 특정 학습에만 필요합니다. 예를 들어 AutoMLStep은 메트릭 및 모델을 생성합니다. 최상의 모델을 얻는 데 사용되는 특정 학습 반복 또는 메트릭을 정의할 수도 있습니다. HyperDriveStep의 경우 출력에 포함할 특정 모델 파일을 정의할 수도 있습니다.

dataset_registration
DatasetRegistration
필수

선택 사항입니다. 내부 매개 변수입니다. PipelineData.as_dataset을 대신 사용해야 합니다.

dataset_output
OutputDatasetConfig
필수

선택 사항입니다. 내부 매개 변수입니다. OutputFileDatasetConfig를 대신 사용해야 합니다.

설명

OutputPortBinding은 파이프라인을 빌드하여 단계 입력 및 출력을 지정할 때 PipelineData와 비슷한 방식으로 사용할 수 있습니다. 차이점은 다른 단계에 대한 입력으로 사용하려면 OutputPortBinding를 InputPortBinding과 함께 사용해야 한다는 것입니다.

OutputPortBinding을 사용하여 파이프라인을 생성하는 예제는 다음과 같습니다.


   from azureml.pipeline.core import OutputPortBinding, InputPortBinding, Pipeline
   from azureml.pipeline.steps import PythonScriptStep

   step_1_output = OutputPortBinding("output", datastore=datastore)

   step_1 = PythonScriptStep(
       name='process data',
       script_name="process_data.py",
       compute_target=compute,
       arguments=["--output", step_1_output],
       outputs=[step_1_output]
   )

   step_2_input = InputPortBinding("input", bind_object=step_1_output)

   step_2 = PythonScriptStep(
       name='train',
       script_name="train.py",
       compute_target=compute,
       arguments=["--input", step_2_input],
       inputs=[step_2_input]
   )

   pipeline = Pipeline(workspace=workspace, steps=[step_1, step_2])

이렇게 하면 두 단계로 파이프라인이 만들어집니다. 프로세스 단계가 실행되고 완료된 다음, 학습 단계가 실행됩니다. Azure ML은 OutputPortBinding 개체에 설명된 대로 프로세스 단계에서 생성된 출력을 학습 단계에 제공합니다.

특성

bind_mode

생성 단계에서 데이터를 만드는 데 사용할 모드("upload" 또는 "mount" 또는 "hdfs")를 가져옵니다.

반환

바인딩 모드입니다.

반환 형식

str

data_type

생성될 데이터 형식을 가져옵니다.

반환

데이터 형식 이름입니다.

반환 형식

str

dataset_registration

데이터 세트 등록 정보를 가져옵니다.

반환

데이터 세트 등록 정보입니다.

반환 형식

datastore

PipelineData가 상주할 데이터 저장소입니다.

반환

데이터 저장소 개체입니다.

반환 형식

Union[<xref:azureml.data.azure_storage_datastore.AbstractAzureStorageDatastore,azureml.data.azure_data_lake_datastore.AzureDataLakeDatastore>]

is_directory

출력이 디렉터리인지 여부를 나타냅니다.

반환

is_directory

반환 형식

name

OutputPortBinding 개체의 이름입니다.

반환

이름입니다.

반환 형식

str

overwrite

"upload" 모드의 경우 기존 데이터를 덮어쓸지 여부를 나타냅니다.

반환

_overwrite

반환 형식

path_on_compute

"upload" 모드의 경우 모듈이 출력을 쓰는 경로입니다.

반환

path_on_compute

반환 형식

str

pipeline_output_name

이 OutputPortBinding에 해당하는 파이프라인 출력의 이름을 가져옵니다.

반환

파이프라인 출력 이름입니다.

반환 형식

str

training_output

학습 출력을 가져옵니다.

반환

학습 출력

반환 형식