集計関数の種類の概要

集計関数は、値の集まりに対して計算を実行し、1 つの値を返します。 これらの関数は、summarize 演算子と組み合わせて使用されます。 この記事では、使用可能なすべての集計関数の一覧を種類別に示します。 スカラー関数については、スカラー関数の種類に関するページを参照してください。

Binary 関数

関数名 説明
binary_all_and() グループのバイナリ AND を使用した集計値を返します。
binary_all_or() グループのバイナリ OR を使用した集計値を返します。
binary_all_xor() グループのバイナリ XOR を使用した集計値を返します。

動的関数

関数名 説明
buildschema() dynamic 入力のすべての値を受け入れる最小スキーマを返します。
make_bag()make_bag_if() グループ内の動的な値のプロパティ バッグを、述語を使用するか、または使用せずに返します。
make_list()make_list_if() グループ内のすべての値の一覧を、述語を使用するか、または使用せずに返します。
make_list_with_nulls() グループ内の null 値を含むすべての値の一覧を返します。
make_set()make_set_if() グループ内の個別の値のセットを、述語を使用するか、または使用せずに返します。

行セレクター関数

関数名 説明
arg_max() 引数が最大化されている場合に 1 つ以上の式を返します。
arg_min() 引数が最小化されている場合に 1 つ以上の式を返します。
take_any()take_anyif() グループの空でないランダムな値を、述語を使用するか、または使用せずに返します。

統計関数

関数名 説明
avg() グループの平均値を返します。
avgif() グループの平均値を返します (述語使用)。
count()countif() グループの数を、述語を使用するか、または使用せずに返します。
count_distinct(), count_distinctif() 述語の有無にかかわらず、グループ内の一意の要素の数を返します。
dcount()dcountif() グループ要素の個別の概数を、述語を使用するか、または使用せずに返します。
hll() グループ要素の HyperLogLog (HLL) の結果、つまり dcount 概数の中間値を返します。
hll_if() グループ要素の HyperLogLog (HLL) の結果を返します。近似値の dcount 中間値 (述語を使用)。
hll_merge() マージされた HLL の結果の値を返します。
max()maxif() グループの最大値を、述語を使用するか、または使用せずに返します。
min()minif() グループの最小値を、述語を使用するか、または使用せずに返します。
percentile() グループのパーセンタイル推定値を 1 つ返します。
percentiles() グループのパーセンタイル推定値を複数返します。
percentiles_array() 配列のパーセンタイルの概数を返します。
percentilesw() グループの重み付けされたパーセンタイルの概数を返します。
percentilesw_array() 配列の重み付けされたパーセンタイルの概数を返します。
stdev()stdevif() サンプルと見なされる母集団のグループ全体の標準偏差を、述語を使用するか、または使用せずに返します。
stdevp() 代表と見なされる母集団のグループ全体の標準偏差を返します。
sum()sumif() グループ内の要素の合計を、述語を使用するか、または使用せずに返します。
tdigest() パーセンタイルの概数の中間結果、つまりグループの重み付けされたパーセンタイルの概数を返します。
tdigest_merge() グループ全体でマージされた tdigest 値を返します。
variance()varianceif() グループの分散を、述語を使用するか、または使用せずに返します。
variancep() 代表と見なされる母集団のグループ全体の分散を返します。