매핑 데이터 흐름의 집계 함수

적용 대상: Azure Data Factory Azure Synapse Analytics

기업용 올인원 분석 솔루션인 Microsoft Fabric의 Data Factory를 사용해 보세요. Microsoft Fabric은 데이터 이동부터 데이터 과학, 실시간 분석, 비즈니스 인텔리전스 및 보고에 이르기까지 모든 것을 다룹니다. 무료로 새 평가판을 시작하는 방법을 알아봅니다!

데이터 흐름은 Azure Data Factory 및 Azure Synapse Pipelines 모두에서 사용할 수 있습니다. 이 문서는 매핑 데이터 흐름에 적용됩니다. 변환을 처음 사용하는 경우 매핑 데이터 흐름을 사용하여 데이터 변환 소개 문서를 참조하세요.

다음 문서에서는 Azure Data Factory 및 Azure Synapse Analytics에서 지원하는 매핑 데이터 흐름의 집계 함수에 관해 자세히 설명합니다.

집계 함수 목록

다음 함수는 집계, 피벗, 피벗 해제 및 창 변환에서만 사용할 수 있습니다.

집계 함수 작업
approxDistinctCount 열에 대한 고유 값의 대략적인 집계 수를 가져옵니다. 선택적 두 번째 매개 변수는 예측 오류를 제어하는 것입니다.
avg 열 값의 평균을 구합니다.
avgIf 조건에 따라 열 값의 평균을 구합니다.
collect 집계 그룹에 있는 식의 모든 값을 배열로 수집합니다. 이 프로세스 중에 구조를 수집하고 대체 구조로 변환할 수 있습니다. 항목 수는 해당 그룹의 행 수와 동일하며 Null 값을 포함할 수 있습니다. 수집된 항목 수는 적어야 합니다.
collectUnique 집계된 그룹에 있는 식의 모든 값을 고유한 배열로 수집합니다. 이 프로세스 동안 구조를 수집하고 대체 구조로 변환할 수 있습니다. 항목 수는 해당 그룹의 행 수보다 작거나 같으며 null 값을 포함할 수 있습니다. 수집된 항목 수는 적어야 합니다.
count 값의 집계 개수를 가져옵니다. 선택적 열을 지정하면 개수에서 Null 값을 무시합니다.
countAll NULL을 포함한 값의 집계 수를 가져옵니다.
countDistinct 열 세트의 고유 값에 대한 집계 합계를 구합니다.
countAllDistinct NULL을 포함한 열 세트에 있는 고유 값의 집계 수를 가져옵니다.
countIf 조건에 따라 값의 집계 개수를 가져옵니다. 선택적 열을 지정하면 개수에서 Null 값을 무시합니다.
covariancePopulation 두 열 간의 모집단 공 분산을 구합니다.
covariancePopulationIf 조건에 따라 두 열의 모집단 공 분산을 구합니다.
covarianceSample 두 열의 샘플 공 분산을 구합니다.
covarianceSampleIf 조건에 따라 두 열의 샘플 공 분산을 구합니다.
first 열 그룹의 첫 번째 값을 가져옵니다. 두 번째 매개 변수 ignoreNulls를 생략하면 false로 간주됩니다.
isDistinct 열 또는 열 집합이 고유한지 확인합니다. null은 고유 값으로 계산하지 않습니다.
kurtosis 열의 첨도를 구합니다.
kurtosisIf 조건에 따라 열의 첨도를 구합니다.
last 열 그룹의 마지막 값을 가져옵니다. 두 번째 매개 변수 ignoreNulls를 생략하면 false로 간주됩니다.
max 열의 최댓값을 구합니다.
maxIf 조건에 따라 열의 최댓값을 구합니다.
mean 열 값의 평균값을 가져옵니다. AVG와 같습니다.
meanIf 조건에 따라 열 값의 평균값을 가져옵니다. avgIf와 같습니다.
min 열의 최솟값을 구합니다.
minIf 조건에 따라 열의 최솟값을 구합니다.
skewness 열의 왜도를 구합니다.
skewnessIf 조건에 따라 열의 왜도를 구합니다.
stddev 열의 표준 편차를 구합니다.
stddevIf 조건에 따라 열의 표준 편차를 구합니다.
stddevPopulation 열의 모집단 표준 편차를 구합니다.
stddevPopulationIf 조건에 따라 열의 모집단 표준 편차를 구합니다.
stddevSample 열의 샘플 표준 편차를 구합니다.
stddevSampleIf 조건에 따라 열의 샘플 표준 편차를 구합니다.
sum 숫자 열의 집계 합계를 구합니다.
sumDistinct 숫자 열의 고유 값에 대한 집계 합계를 구합니다.
sumDistinctIf 기준에 따라 숫자 열의 집계 합계를 가져옵니다. 조건의 기준은 어떤 열도 될 수 있습니다.
sumIf 기준에 따라 숫자 열의 집계 합계를 가져옵니다. 조건의 기준은 어떤 열도 될 수 있습니다.
topN 이 열의 상위 N개 값을 가져옵니다.
분산 열의 분산을 구합니다.
varianceIf 조건에 따라 열의 분산을 구합니다.
variancePopulation 열의 모집단 분산을 구합니다.
variancePopulationIf 조건에 따라 열의 모집단 분산을 구합니다.
varianceSample 열의 불편 분산을 구합니다.
varianceSampleIf 조건에 따라 열의 불편 분산을 구합니다.