RelationalGroupedDataset クラス

定義

DataFrame の集計に使用する一連のメソッド。

public sealed class RelationalGroupedDataset
type RelationalGroupedDataset = class
Public NotInheritable Class RelationalGroupedDataset
継承
RelationalGroupedDataset

メソッド

Agg(Column, Column[])

一連の集計列を指定して集計を計算します。

Apply(StructType, Func<DataFrame,DataFrame>)

UDF を使用して現在の DataFrame の各グループをマップし、結果を DataFrame として返します。

ユーザー定義関数は を受け取り、別DataFrameDataFrame を返す必要があります。 各グループについて、すべての列が としてユーザー関数に渡 DataFrame され、返された FxDataFrame が DataFrame として結合されます。

返される DataFrame は任意の長さにすることができ、そのスキーマは と一致 returnTypeする必要があります。

Apply(StructType, Func<RecordBatch,RecordBatch>)

UDF を使用して現在の DataFrame の各グループをマップし、結果を DataFrame として返します。

ユーザー定義関数は、Apache Arrow RecordBatch を受け取り、別の Apache Arrow RecordBatch を返す必要があります。 グループごとに、すべての列が RecordBatch としてユーザー関数に渡され、返された RecordBatch が DataFrame として結合されます。

返される Apache.Arrow.RecordBatch は任意の長さにすることができ、そのスキーマは と一致 returnTypeする必要があります。

Avg(String[])

各グループの各数値列の平均値を計算します。

Count()

各グループの行数をカウントします。

Max(String[])

各グループの各数値列の最大値を計算します。

Mean(String[])

各グループの各数値列の平均値を計算します。

Min(String[])

各グループの各数値列の最小値を計算します。

Pivot(Column)

現在の DataFrame の列をピボットし、指定した集計を実行します。

Pivot(Column, IEnumerable<Object>)

現在の DataFrame の列をピボットし、指定した集計を実行します。

Pivot(String)

現在の DataFrame の列をピボットし、指定した集計を実行します。

Pivot(String, IEnumerable<Object>)

現在の DataFrame の列をピボットし、指定した集計を実行します。

Sum(String[])

各グループの各数値列の合計を計算します。

適用対象