Поделиться через


Агрегатные функции в сопоставлении потоков данных

ОБЛАСТЬ ПРИМЕНЕНИЯ: Фабрика данных Azure Azure Synapse Analytics

Совет

Попробуйте использовать фабрику данных в Microsoft Fabric, решение для аналитики с одним интерфейсом для предприятий. Microsoft Fabric охватывает все, от перемещения данных до обработки и анализа данных в режиме реального времени, бизнес-аналитики и отчетности. Узнайте, как бесплатно запустить новую пробную версию !

Потоки данных доступны как в конвейерах Фабрики данных Azure, так и в конвейерах Azure Synapse Analytics. Эта статья относится к потокам данных для сопоставления. Если вы не знакомы с преобразованиями, ознакомьтесь с вводной статьей "Преобразование данных с помощью потоков данных сопоставления".

В этой статье содержатся сведения об агрегатных функциях, поддерживаемых Azure Data Factory и Azure Synapse Analytics в сопоставлении потоков данных.

Список агрегатных функций

Следующие функции доступны только в агрегатных, сводных, несводных и оконных преобразованиях.

Агрегатная функция Задача
approxDistinctCount Возвращает приблизительное общее число различных значений для столбца. Необязательный второй параметр предназначен для управления ошибкой оценки.
avg Возвращает среднее значение столбца.
avgIf Возвращает среднее значение столбца на основе критериев.
collect Собирает все значения выражения в агрегированной группе в массив. В ходе этого процесса можно собирать и преобразовывать структуры в альтернативные структуры. Число элементов равно количеству строк в этой группе и может содержать значения NULL. Количество собранных элементов должно быть небольшим.
collectUnique Собирает все значения выражения в агрегированной группе в уникальный массив. В ходе этого процесса можно собирать и преобразовывать структуры в альтернативные структуры. Количество элементов меньше или равно числу строк в этой группе и может содержать значения NULL. Количество собранных элементов должно быть небольшим.
count Возвращает совокупное количество значений. Если указаны необязательные столбцы, он игнорирует NULL значения в счетчике.
countAll Возвращает агрегированное количество значений, включая NULL значения.
countDistinct Возвращает совокупное число различных значений набора столбцов.
countAllDistinct Возвращает общее количество различных значений набора столбцов, включая NULL значения.
countIf Возвращает общее количество значений на основе критериев. Если указан необязательный столбец, он игнорирует NULL значения в счетчике.
covariancePopulation Возвращает ковариацию по всей совокупности значений двух столбцов.
covariancePopulationIf Возвращает ковариацию выборки двух столбцов на основе критериев.
covarianceSample Возвращает ковариацию выборки двух столбцов.
covarianceSampleIf Возвращает выборочную ковариацию двух столбцов с учетом критериев.
first Возвращает первое значение группы столбцов. Если второй параметр ignoreNulls опущен, предполагается значение false.
isDistinct Определяет, является ли столбец или набор столбцов уникальным. Он не подсчитывает значение NULL в качестве отдельного значения.
kurtosis Возвращает эксцесс столбца.
kurtosisIf Получает куртоз столбца на основе критериев.
last Возвращает последнее значение группы столбцов. Если второй параметр ignoreNulls опущен, предполагается значение false.
max Возвращает максимальное значение столбца.
maxIf Возвращает максимальное значение столбца на основе критериев.
mean Возвращает среднее значение столбца. То же, что и AVG.
meanIf Получает среднее значение значений столбца на основе критериев. То же, что и avgIf.
min Возвращает минимальное значение столбца.
minIf Возвращает минимальное значение столбца на основе условий.
skewness Возвращает асимметрию столбца.
skewnessIf Возвращает скошенность столбца на основе критериев.
stddev Возвращает стандартное отклонение для столбца.
stddevIf Возвращает стандартное отклонение столбца на основе критериев.
stddevPopulation Возвращает стандартное отклонение по всей совокупности значений столбца.
stddevPopulationIf Вычисляет стандартное отклонение генеральной совокупности для столбца на основе заданных критериев.
stddevSample Возвращает выборочное стандартное отклонение для столбца.
stddevSampleIf Возвращает выборочное стандартное отклонение столбца на основе критериев.
sum Возвращает общую сумму числового столбца.
sumDistinct Возвращает общую сумму различных значений числового столбца.
sumDistinctIf Возвращает агрегированную сумму числового столбца на основе критериев. Условие может быть основано на любом столбце.
sumIf Возвращает агрегированную сумму числового столбца на основе критериев. Условие может быть основано на любом столбце.
topN Возвращает верхние N значения для этого столбца.
variance Возвращает дисперсию столбца.
varianceIf Возвращает дисперсию столбца в соответствии с заданными критериями.
variancePopulation Возвращает дисперсию по всей совокупности значений столбца.
variancePopulationIf Возвращает выборочную дисперсию данных столбца на основе заданных критериев.
varianceSample Возвращает несмещенную дисперсию столбца.
varianceSampleIf Возвращает несмещённую дисперсию столбца в соответствии с заданными критериями.