PipelineOutputTabularDataset 클래스

참조

Azure Machine Learning 표 형식 데이터 세트로 승격된 중간 파이프라인 데이터를 나타냅니다.

중간 데이터가 Azure Machine Learning 데이터 집합으로 승격되면 후속 단계에서 DataReference 대신 데이터 집합으로도 이용됩니다.

Azure Machine Learning 데이터 세트로 승격될 중간 데이터를 만듭니다.

상속: PipelineOutputAbstractDataset

PipelineOutputTabularDataset

생성자

PipelineOutputTabularDataset(pipeline_output_dataset, additional_transformations)

매개 변수

pipeline_output_dataset: PipelineOutputFileDataset

필수

표 형식 데이터 세트로 변환될 중간 출력을 나타내는 파일 데이터 세트입니다.

additional_transformations: <xref:azureml.dataprep.Dataflow>

필수

파일 데이터 세트 위에 적용할 추가 변환입니다.

pipeline_output_dataset: PipelineOutputFileDataset

필수

표 형식 데이터 세트로 변환될 중간 출력을 나타내는 파일 데이터 세트입니다.

additional_transformations: <xref:azureml.dataprep.Dataflow>

필수

파일 데이터 세트 위에 적용할 추가 변환입니다.

메서드

create_input_binding	입력 바인딩을 만듭니다.
drop_columns	데이터 세트에서 지정한 열을 삭제합니다.
keep_columns	지정된 열을 유지하고 데이터 세트에서 다른 모든 열을 삭제합니다.
random_split	데이터 세트의 레코드를 지정된 백분율에 따라 임의로 대략 두 부분으로 분할합니다.

create_input_binding

입력 바인딩을 만듭니다.

create_input_binding()

반환

이 PipelineData를 원본으로 사용하는 InputPortBinding입니다.

반환 형식

InputPortBinding

drop_columns

데이터 세트에서 지정한 열을 삭제합니다.

drop_columns(columns)

매개 변수

columns: str 또는 list[str]

필수

삭제할 열의 이름 또는 이름 목록입니다.

반환

지정된 열만 삭제된 새 중간 데이터를 반환합니다.

반환 형식

PipelineOutputTabularDataset

keep_columns

지정된 열을 유지하고 데이터 세트에서 다른 모든 열을 삭제합니다.

keep_columns(columns)

매개 변수

columns: str 또는 list[str]

필수

유지할 열의 이름 또는 이름 목록입니다.

반환

지정된 열만 보관된 새 중간 데이터를 반환합니다.

반환 형식

PipelineOutputTabularDataset

random_split

데이터 세트의 레코드를 지정된 백분율에 따라 임의로 대략 두 부분으로 분할합니다.

random_split(percentage, seed=None)

매개 변수

percentage: float

필수

데이터 세트를 분할할 대략적인 백분율입니다. 이는 0.0에서 1.0 사이의 숫자여야 합니다.

seed: int

기본값: None

난수 생성기에 사용할 선택적 시드입니다.

반환

분할 후 두 데이터 세트를 나타내는 새 TabularDataset 개체의 튜플을 반환합니다.

반환 형식

(TabularDataset, TabularDataset)

다음을 통해 공유

PipelineOutputTabularDataset 클래스

생성자

매개 변수

메서드

create_input_binding

반환

반환 형식

drop_columns

매개 변수

반환

반환 형식

keep_columns

매개 변수

반환

반환 형식

random_split

매개 변수

반환

반환 형식

피드백

피드백

추가 리소스