共用方式為


映射資料流中的聚合函數

適用於:Azure Data Factory Azure Synapse Analytics

秘訣

試用 Microsoft Fabric 中的 Data Factory,這是適用於企業的全方位分析解決方案。 Microsoft Fabric 涵蓋從資料移動到資料科學、即時分析、商業智慧和報告的所有項目。 了解如何免費開始新的試用

資料流程可在 Azure Data Factory 管線和 Azure Synapse Analytics 管線中使用。 本文適用於對應資料流。 如果您不熟悉資料轉換,請參閱入門文章使用對應資料流程轉換資料

本文提供 Azure Data Factory 與 Azure Synapse Analytics 在資料流繪圖中所支援的聚合函數細節。

彙總函數清單

以下函式僅在聚合、樞軸、非樞軸及視窗轉換中提供。

彙總函式 Task
approxDistinctCount 取得資料行相異值的近似彙總計數。 選擇性的第二個參數是控制估計錯誤。
avg 取得資料行的平均值。
avgIf 根據標準取得欄位數值的平均值。
collect 將彙總群組中運算式的所有值收集到陣列中。 在這個過程中,你可以收集結構並將其轉換為其他結構。 項目數量等於該群組的列數,且可能包含空值。 收集的項目數應該很小。
collectUnique 將彙總群組中運算式的所有值收集到唯一陣列中。 在這個過程中,你可以收集結構並將其轉換為替代結構。 項目數量較小或等於該群組的列數,且可能包含空值。 收集的項目數應該很小。
計數 取得值的彙總計數。 若指定可選欄位,則忽略 NULL 計數中的值。
countAll 取得數值的總和,包括 NULL 數值。
countDistinct 取得一組資料行的相異值彙總計數。
countAllDistinct 取得一組欄位不同值的總計數,包括 NULL 值。
countIf 根據標準取得各項總計數值。 若指定可選欄位,則忽略 NULL 計數中的值。
covariancePopulation 取得兩個資料行之間的母體共變數。
covariancePopulationIf 根據準則取得兩個資料行的母體共變數。
covarianceSample 取得兩個資料行的樣本共變數。
covarianceSampleIf 根據標準取得兩欄的樣本協方差。
first 取得資料行群組的第一個值。 若省略第二個參數 ignoreNulls ,則假設為假。
isDistinct 尋找資料行或一組資料行是否相異。 它不把零值算作獨立值。
kurtosis 取得資料行的峰態。
kurtosisIf 根據準則,取得資料行的峰態。
last 取得資料行群組的最後一個值。 若省略第二個參數 ignoreNulls ,則假設為假。
max 取得資料行的最大值。
maxIf 根據條件獲得欄位的最大值。
mean 取得資料行的平均值。 與 AVG相同。
meanIf 根據條件取得欄位數值的平均值。 與 avgIf相同。
min 取得資料行的最小值。
minIf 根據條件,獲取欄的最小值。
skewness 取得資料行的偏態。
skewnessIf 根據條件取得欄位的偏態。
stddev 取得資料行的標準差。
stddevIf 根據條件計算欄位的標準差。
stddevPopulation 取得資料行的母體標準差。
stddevPopulationIf 根據準則,取得資料行的母體標準差。
stddevSample 取得資料行的樣本標準差。
stddevSampleIf 根據標準取得欄位的樣本標準差。
sum 取得數值資料行的彙總總和。
sumDistinct 取得數值資料行的相異值彙總總和。
sumDistinctIf 根據條件取得數值欄位的總和。 條件可依據任何資料行。
sumIf 根據條件取得數值欄位的總和。 條件可依據任何資料行。
topN 取得此資料行的前幾個 N 值。
variance 取得資料行的變異數。
varianceIf 根據條件取得欄位的變異數。
variancePopulation 取得資料行的母體變異數。
variancePopulationIf 根據條件取得欄位的母體變異數。
varianceSample 取得資料行的無偏變異數。
varianceSampleIf 根據標準獲得欄位的無偏變異數。