적용 대상:
Azure Data Factory
Azure Synapse Analytics
팁
기업용 올인원 분석 솔루션인 Microsoft Fabric의 Data Factory를 사용해 보세요. Microsoft Fabric은 데이터 이동부터 데이터 과학, 실시간 분석, 비즈니스 인텔리전스 및 보고에 이르기까지 모든 것을 다룹니다. 무료로 새 평가판을 시작하는 방법을 알아보세요!
데이터 흐름은 Azure Data Factory 파이프라인과 Azure Synapse Analytics 파이프라인 모두에서 사용할 수 있습니다. 이 문서는 매핑 데이터 흐름에 적용됩니다. 변환을 접하는 경우 매핑 데이터 흐름을 사용하여 데이터 변환 소개 문서를 참조하세요.
이 문서에서는 매핑 데이터 흐름에서 Azure Data Factory 및 Azure Synapse Analytics에서 지원하는 집계 함수에 대해 자세히 설명합니다.
집계 함수 목록
다음 함수는 집계, 피벗, 피벗 해제 및 창 변환에서만 사용할 수 있습니다.
| 집계 함수 | 작업 |
|---|---|
| approxDistinctCount | 열에 대한 고유 값의 대략적인 집계 수를 가져옵니다. 선택적 두 번째 매개 변수는 예측 오류를 제어하는 것입니다. |
| avg | 열 값의 평균을 구합니다. |
| avgIf | 조건에 따라 열 값의 평균을 가져옵니다. |
| collect | 집계 그룹에 있는 식의 모든 값을 배열로 수집합니다. 이 프로세스 중에는 구조를 수집하고 대체 구조로 변환할 수 있습니다. 항목 수는 해당 그룹의 행 수와 같으며 null 값을 포함할 수 있습니다. 수집된 항목 수는 적어야 합니다. |
| collectUnique | 집계된 그룹에 있는 식의 모든 값을 고유한 배열로 수집합니다. 이 프로세스 중에는 구조를 수집하고 대체 구조로 변환할 수 있습니다. 항목 수는 해당 그룹의 행 수와 작거나 같으며 null 값을 포함할 수 있습니다. 수집된 항목 수는 적어야 합니다. |
| count | 값의 집계 개수를 가져옵니다. 선택적 열을 지정하면 개수에서 NULL 값이 무시됩니다. |
| countAll | 값을 포함하여 NULL 값의 총합 수를 가져옵니다. |
| countDistinct | 열 세트의 고유 값에 대한 집계 합계를 구합니다. |
| countAllDistinct | 열 집합에서 NULL 값을 포함해 각 열의 고유값을 집계하여 그 수를 가져옵니다. |
| countIf | 조건에 따라 값의 집계 수를 가져옵니다. 선택적 열을 지정하면 개수에서 NULL 값을 무시합니다. |
| covariancePopulation | 두 열 간의 모집단 공 분산을 구합니다. |
| covariancePopulationIf | 조건에 따라 두 열의 모집단 공변도를 가져옵니다. |
| covarianceSample | 두 열의 샘플 공 분산을 구합니다. |
| covarianceSampleIf | 조건에 따라 두 열의 샘플 공분산을 계산하여 가져옵니다. |
| first | 열 그룹의 첫 번째 값을 가져옵니다. 두 번째 매개 변수 ignoreNulls 를 생략하면 false로 간주됩니다. |
| isDistinct | 열 또는 열 집합이 고유한지 확인합니다. null은 고유 값으로 계산되지 않습니다. |
| kurtosis | 열의 첨도를 구합니다. |
| kurtosisIf | 조건에 따라 열의 첨도를 가져옵니다. |
| last | 열 그룹의 마지막 값을 가져옵니다. 두 번째 매개 변수 ignoreNulls 를 생략하면 false로 간주됩니다. |
| max | 열의 최댓값을 구합니다. |
| maxIf | 조건에 따라 열의 최대값을 가져옵니다. |
| mean | 열 값의 평균값을 가져옵니다.
AVG와 동일합니다. |
| meanIf | 조건에 따라 열 값의 평균을 가져옵니다.
avgIf와 동일합니다. |
| min | 열의 최솟값을 구합니다. |
| minIf | 조건에 따라 열의 최소값을 가져옵니다. |
| skewness | 열의 왜도를 구합니다. |
| skewnessIf | 기준에 따라 열의 왜도를 구합니다. |
| stddev | 열의 표준 편차를 구합니다. |
| stddevIf | 조건에 따라 열의 표준 편차를 가져옵니다. |
| stddevPopulation | 열의 모집단 표준 편차를 구합니다. |
| stddevPopulationIf | 조건에 따라 열의 모집단 표준 편차를 가져옵니다. |
| stddevSample | 열의 샘플 표준 편차를 구합니다. |
| stddevSampleIf | 기준에 따라 열의 샘플 표준 편차를 구합니다. |
| sum | 숫자 열의 집계 합계를 구합니다. |
| sumDistinct | 숫자 열의 고유 값에 대한 집계 합계를 구합니다. |
| sumDistinctIf | 조건에 따라 숫자 열의 집계 합계를 가져옵니다. 조건의 기준은 어떤 열도 될 수 있습니다. |
| sumIf | 조건에 따라 숫자 열의 집계 합계를 가져옵니다. 조건의 기준은 어떤 열도 될 수 있습니다. |
| topN | 이 열의 상위 N 값을 가져옵니다. |
| 분산 | 열의 분산을 구합니다. |
| varianceIf | 기준에 따라 열의 분산을 구합니다. |
| variancePopulation | 열의 모집단 분산을 구합니다. |
| variancePopulationIf | 조건을 기반으로 열의 모집단 분산을 계산합니다. |
| varianceSample | 열의 불편 분산을 구합니다. |
| varianceSampleIf | 기준에 따라 열의 바이어스되지 않은 분산을 구합니다. |