Share via


マッピング データ フローの集計関数

適用対象: Azure Data Factory Azure Synapse Analytics

ヒント

企業向けのオールインワン分析ソリューション、Microsoft Fabric の Data Factory をお試しください。 Microsoft Fabric は、データ移動からデータ サイエンス、リアルタイム分析、ビジネス インテリジェンス、レポートまで、あらゆるものをカバーしています。 無料で新しい試用版を開始する方法について説明します。

データ フローは、Azure Data Factory および Azure Synapse Pipelines の両方で使用できます。 この記事は、マッピング データ フローに適用されます。 変換を初めて使用する場合は、概要の記事「マッピング データ フローを使用してデータを変換する」を参照してください。

以下の記事では、Azure Data Factory および Azure Synapse Analytics でサポートされるマッピング データ フローの集計関数に関する詳細情報を提供します。

集計関数一覧

次の関数は、集計、ピボット、ピボット解除、ウィンドウ変換でのみ使用できます。

集計関数 タスク
approxDistinctCount 列の個別の値のおおよその集計数を取得します。 省略可能な 2 番目のパラメーターは、推定誤差を制御するためのものです。
avg 列の値の平均を取得します。
avgIf 条件に基づいて、列の値の平均を取得します。
collect 集計されたグループ内の式のすべての値を配列に収集します。 この処理中に構造体を収集し、別の構造体に変換できます。 項目の数はそのグループの行数と等しくなります。また、null 値を含めることができます。 収集する項目の数は少なくするようにします。
collectUnique 集計されたグループ内の式のすべての値を一意の配列に収集します。 この処理中に構造体を収集し、別の構造体に変換できます。項目の数は、そのグループ内の行数以下となり、null 値を含めることができます。 収集する項目の数は少なくするようにします。
count 値の集計カウントを取得します。 省略可能な列を指定すると、カウントの NULL 値が無視されます。
countAll null 値を含む値の集計カウントを取得します。
countDistinct 列セットの個別値の集計カウントを取得します。
countAllDistinct null 値を含む列セットの個別の値の集計カウントを取得します。
countIf 条件に基づいて、値の集計カウントを取得します。 省略可能な列を指定すると、カウントの NULL 値が無視されます。
covariancePopulation 2 つの列の間の母共分散を取得します。
covariancePopulationIf 条件に基づいて、2 つの列の間の母共分散を取得します。
covarianceSample 2 つの列の標本共分散を取得します。
covarianceSampleIf 条件に基づいて、2 つの列の標本共分散を取得します。
first 列グループの最初の値を取得します。 2 番目のパラメーター ignoreNulls を省略すると、false であると見なされます。
isDistinct 列または列セットが個別かどうかを検出します。 null は個別の値としてカウントされません。
kurtosis 列の尖度を取得します。
kurtosisIf 条件に基づいて、列の尖度を取得します。
last 列グループの最後の値を取得します。 2 番目のパラメーター ignoreNulls を省略すると、false であると見なされます。
max 列の最大値を取得します。
maxIf 条件に基づいて、列の値の最大値を取得します。
mean 列の値の平均を取得します。 AVG と同じです。
meanIf 条件に基づいて、列の値の平均を取得します。 avgIf と同じです。
min 列の最小値を取得します。
minIf 条件に基づいて、列の値の最小値を取得します。
skewness 列の歪度を取得します。
skewnessIf 条件に基づいて、列の歪度を取得します。
stddev 列の標準偏差を取得します。
stddevIf 条件に基づいて、列の標準偏差を取得します。
stddevPopulation 列の母標準偏差を取得します。
stddevPopulationIf 条件に基づいて、列の母標準偏差を取得します。
stddevSample 列の標本標準偏差を取得します。
stddevSampleIf 条件に基づいて、列の標本標準偏差を取得します。
sum 数値列の集計を取得します。
sumDistinct 数値列の個別値の集計を取得します。
sumDistinctIf 条件に基づいて、数値列の集計を取得します。 条件は、任意の列に基づくことができます。
sumIf 条件に基づいて、数値列の集計を取得します。 条件は、任意の列に基づくことができます。
topN この列の上位 N の値を取得します。
variance 列の分散を取得します。
varianceIf 条件に基づいて、列の分散を取得します。
variancePopulation 列の母分散を取得します。
variancePopulationIf 条件に基づいて、列の母分散を取得します。
varianceSample 列の不偏分散を取得します。
varianceSampleIf 条件に基づいて、列の不偏分散を取得します。