PipelineOutputTabularDataset 클래스

Azure Machine Learning 표 형식 데이터 세트로 승격된 중간 파이프라인 데이터를 나타냅니다.

중간 데이터가 Azure Machine Learning 데이터 집합으로 승격되면 후속 단계에서 DataReference 대신 데이터 집합으로도 이용됩니다.

Azure Machine Learning 데이터 세트로 승격될 중간 데이터를 만듭니다.

상속
PipelineOutputTabularDataset

생성자

PipelineOutputTabularDataset(pipeline_output_dataset, additional_transformations)

매개 변수

pipeline_output_dataset
PipelineOutputFileDataset
필수

표 형식 데이터 세트로 변환될 중간 출력을 나타내는 파일 데이터 세트입니다.

additional_transformations
<xref:azureml.dataprep.Dataflow>
필수

파일 데이터 세트 위에 적용할 추가 변환입니다.

pipeline_output_dataset
PipelineOutputFileDataset
필수

표 형식 데이터 세트로 변환될 중간 출력을 나타내는 파일 데이터 세트입니다.

additional_transformations
<xref:azureml.dataprep.Dataflow>
필수

파일 데이터 세트 위에 적용할 추가 변환입니다.

메서드

create_input_binding

입력 바인딩을 만듭니다.

drop_columns

데이터 세트에서 지정한 열을 삭제합니다.

keep_columns

지정된 열을 유지하고 데이터 세트에서 다른 모든 열을 삭제합니다.

random_split

데이터 세트의 레코드를 지정된 백분율에 따라 임의로 대략 두 부분으로 분할합니다.

create_input_binding

입력 바인딩을 만듭니다.

create_input_binding()

반환

이 PipelineData를 원본으로 사용하는 InputPortBinding입니다.

반환 형식

drop_columns

데이터 세트에서 지정한 열을 삭제합니다.

drop_columns(columns)

매개 변수

columns
str 또는 list[str]
필수

삭제할 열의 이름 또는 이름 목록입니다.

반환

지정된 열만 삭제된 새 중간 데이터를 반환합니다.

반환 형식

keep_columns

지정된 열을 유지하고 데이터 세트에서 다른 모든 열을 삭제합니다.

keep_columns(columns)

매개 변수

columns
str 또는 list[str]
필수

유지할 열의 이름 또는 이름 목록입니다.

반환

지정된 열만 보관된 새 중간 데이터를 반환합니다.

반환 형식

random_split

데이터 세트의 레코드를 지정된 백분율에 따라 임의로 대략 두 부분으로 분할합니다.

random_split(percentage, seed=None)

매개 변수

percentage
float
필수

데이터 세트를 분할할 대략적인 백분율입니다. 이는 0.0에서 1.0 사이의 숫자여야 합니다.

seed
int
기본값: None

난수 생성기에 사용할 선택적 시드입니다.

반환

분할 후 두 데이터 세트를 나타내는 새 TabularDataset 개체의 튜플을 반환합니다.

반환 형식