Azure Data Factory 변환 유형 설명

완료됨

매핑 데이터 흐름은 데이터를 수정할 수 있는 여러 다양한 변환 유형을 제공합니다. 변환 유형은 다음 범주로 분류됩니다.

범주 이름 설명
스키마 한정자 변환 이 유형의 변환은 변환 작업을 기반으로 새 열을 생성하여 싱크 대상을 수정합니다. 이에 대한 예로는 기존 열에서 수행된 작업을 기반으로 새 열을 생성하는 파생 열 변환을 들 수 있습니다.
행 한정자 변환 이 유형의 변환은 행이 대상에 표시되는 방식에 영향을 줍니다. 이에 대한 예로는 데이터를 정렬하는 정렬 변환을 들 수 있습니다.
다중 입력/출력 변환 이 유형의 변환은 새 데이터 파이프라인을 생성하거나 파이프라인을 하나로 병합합니다. 이에 대한 예로는 여러 데이터 스트림을 결합하는 공용 구조체 변환을 들 수 있습니다.

다음은 매핑 데이터 흐름에서 사용할 수 있는 변환 목록입니다.

이름 범주 설명
집계 스키마 한정자 기존 열 또는 계산 열로 그룹화된 SUM, MIN, MAX, COUNT와 같은 다양한 유형의 집계를 정의합니다.
행 변경 행 한정자 행에 대한 삽입, 삭제, 업데이트 및 upsert 정책을 설정합니다. 일대다 조건을 식으로 추가할 수 있습니다. 일대다 조건은 각 행이 첫 번째로 일치하는 식에 해당하는 정책으로 표시되므로 우선 순위에 따라 지정해야 합니다. 각 조건으로 인해 하나의 행(또는 여러 행)이 삽입, 업데이트, 삭제 또는 upsert될 수 있습니다. 행 변경은 데이터베이스에 대해 DDL 작업과 DML 작업을 모두 생성할 수 있습니다.
조건부 분할 다중 입력/출력 일치 조건에 따라 데이터 행을 서로 다른 스트림으로 라우팅합니다.
파생 열 스키마 한정자 데이터 흐름 식 언어를 사용하여 새 열을 생성하거나 기존 필드를 수정합니다.
Exists 다중 입력/출력 데이터가 다른 원본 또는 스트림에 있는지 확인합니다.
Filter 행 한정자 조건에 따라 행을 필터링합니다.
평면화(flatten) 스키마 한정자 JSON과 같은 계층 구조 내부의 배열 값을 가져와서 개별 행으로 언롤합니다.
Join 다중 입력/출력 두 원본 또는 스트림의 데이터를 결합합니다.
조회 다중 입력/출력 다른 원본의 데이터를 참조할 수 있습니다.
새 분기 다중 입력/출력 동일한 데이터 스트림에 대해 여러 작업 및 변환 세트를 적용합니다.
피벗 스키마 한정자 하나 이상의 그룹화 열에 개별 열로서 변환된 고유한 행 값이 있는 집계입니다.
Select 스키마 한정자 열 및 스트림 이름의 별칭을 지정하고, 열을 삭제하거나 다시 정렬합니다.
싱크 - 데이터의 최종 대상입니다.
Sort 행 한정자 현재 데이터 스트림에서 들어오는 행을 정렬합니다.
원본 - 데이터 흐름의 데이터 원본입니다.
서로게이트 키 스키마 한정자 증가하는 업무 외 임의 키 값을 추가합니다.
Union 다중 입력/출력 여러 데이터 스트림을 수직으로 결합합니다.
피벗 해제 스키마 한정자 열을 행 값으로 피벗합니다.
스키마 한정자 데이터 스트림에서 창 기반 열 집계를 정의합니다.

데이터 흐름 식 작성기

정의할 수 있는 일부 변환에는 해당 상자에 데이터 흐름의 열, 필드, 변수, 매개 변수, 함수를 사용하여 변환 기능을 사용자 지정할 수 있는 데이터 흐름 식 작성기가 있습니다.

식을 작성하려면 변환 내의 식 텍스트 상자를 클릭할 때 시작되는 식 작성기를 사용합니다. 변환에 사용할 열을 선택할 때 “계산 열” 옵션이 표시되는 경우도 있습니다. 이 옵션을 클릭해도 식 작성기가 시작됩니다.

Using the expression builder in the Mapping Data Flow

식 작성기 도구는 기본적으로 텍스트 편집기 옵션으로 설정되어 있습니다. 자동 완성 기능은 구문 검사 및 강조 표시를 사용하여 전체 Azure Data Factory Data Flow 개체 모델에서 읽어옵니다.