다음을 통해 공유


매핑 데이터 흐름의 창 함수

적용 대상: Azure Data Factory Azure Synapse Analytics

기업용 올인원 분석 솔루션인 Microsoft Fabric의 Data Factory를 사용해 보세요. Microsoft Fabric은 데이터 이동부터 데이터 과학, 실시간 분석, 비즈니스 인텔리전스 및 보고에 이르기까지 모든 것을 다룹니다. 무료로 새 평가판을 시작하는 방법을 알아보세요!

데이터 흐름은 Azure Data Factory 파이프라인과 Azure Synapse Analytics 파이프라인 모두에서 사용할 수 있습니다. 이 문서는 매핑 데이터 흐름에 적용됩니다. 변환을 접하는 경우 매핑 데이터 흐름을 사용하여 데이터 변환 소개 문서를 참조하세요.

이 문서에서는 매핑 데이터 흐름에서 Azure Data Factory 및 Azure Synapse Analytics에서 지원하는 창 함수에 대한 세부 정보를 제공합니다.

창 함수 목록

다음 함수는 창 변환에서만 사용할 수 있습니다.

창 함수 작업
cumeDist 파티션의 모든 값을 기준으로 값의 위치를 계산합니다. 결과는 파티션 순서에서 현재 행보다 앞에 있거나 같은 위치에 있는 행 수를 창 파티션의 총 행 수로 나눈 값입니다. 순서 내의 모든 동률 값은 동일한 위치로 간주됩니다.
denseRank 지정된 값 그룹에서 값의 순위는 절에 따른 창 순서로 계산됩니다. 결과는 파티션 순서에서 현재 행보다 앞에 있거나 같은 위치에 있는 행의 수에 1을 더한 것입니다. 값은 시퀀스에서 간격을 생성하지 않습니다. 이 함수는 denseRank 데이터가 정렬되지 않은 경우에도 작동하며 값의 변경 사항을 찾습니다.
lag 현재 행 앞에 계산된 n 첫 번째 매개 변수 행의 값을 가져옵니다. 두 번째 매개 변수는 뒤를 돌아볼 행 수이며 기본값은 .입니다 1. 행이 많지 않은 경우 기본값을 지정하지 않으면 값 null 이 반환됩니다.
lead 현재 행 뒤의 첫 번째 매개 변수가 계산된 n 행의 값을 가져옵니다. 두 번째 매개 변수는 기대할 행 수이며 기본값은 다음과 같습니다 1. 행이 많지 않은 경우 기본값을 지정하지 않으면 값 null 이 반환됩니다.
nTile 각 창 파티션의 행을 n개 버킷으로 나누며, 1에서 최대 n까지 범위를 지정합니다. 버킷 값은 최대 1 차이납니다. 파티션의 행 수가 버킷 수로 균등하게 나누지 않는 경우 나머지 값은 첫 번째 버킷부터 시작하여 버킷당 하나씩 분산됩니다. NTile 함수는 tertiles, 사분위수, 십진수 및 기타 일반적인 요약 통계를 계산하는 데 유용합니다.

이 함수는 초기화 중에 두 개의 변수를 계산합니다. 일반 버킷의 크기에는 행이 하나 더 추가됩니다. 두 변수는 현재 파티션의 크기를 기준으로 합니다. 계산 프로세스 중에 함수는 현재 행 번호, 현재 버킷 번호 및 버킷이 변경되는 행 번호(bucketThreshold)를 추적합니다. 현재 행 번호가 버킷 임계값에 도달하면 버킷 값이 하나씩 증가합니다. 임계값은 버킷 크기로 증가합니다(현재 버킷이 패딩된 경우 하나 더 추가).
rank 지정된 값 그룹에서 값의 순위는 절에 따른 창 순서로 계산됩니다. 결과는 파티션 순서에서 현재 행보다 앞에 있거나 같은 위치에 있는 행의 수에 1을 더한 것입니다. 값은 시퀀스에서 간격을 생성합니다. 이 함수는 rank 데이터가 정렬되지 않은 경우에도 작동하며 값의 변경 사항을 찾습니다.
rowNumber 으로 시작하는 1창의 행에 대해 순차적 행 번호 매기기를 할당합니다.