RelationalGroupedDataset 类

定义

用于对数据帧进行聚合的一组方法。

public sealed class RelationalGroupedDataset
type RelationalGroupedDataset = class
Public NotInheritable Class RelationalGroupedDataset
继承
RelationalGroupedDataset

方法

Agg(Column, Column[])

通过指定一系列聚合列来计算聚合。

Apply(StructType, Func<DataFrame,DataFrame>)

使用 UDF 映射当前数据帧的每个组,并将结果作为数据帧返回。

用户定义函数应采用 并返回另一个 DataFrameDataFrame。 对于每个组,所有列作为 一起 DataFrame 传递给用户函数,返回的 FxDataFrame 合并为数据帧。

返回的 DataFrame 可以是任意长度,并且其架构必须与 匹配 returnType

Apply(StructType, Func<RecordBatch,RecordBatch>)

使用 UDF 映射当前数据帧的每个组,并将结果作为数据帧返回。

用户定义的函数应采用 Apache Arrow RecordBatch 并返回另一个 Apache Arrow RecordBatch。 对于每个组,所有列作为 RecordBatch 一起传递给用户函数,返回的 RecordBatch 将合并为数据帧。

返回的 Apache.Arrow.RecordBatch 可以是任意长度,并且其架构必须与 匹配 returnType

Avg(String[])

计算每个组的每个数值列的平均值。

Count()

计算每个组的行数。

Max(String[])

计算每个组的每个数值列的最大值。

Mean(String[])

计算每个组的每个数值列的平均值。

Min(String[])

计算每个组的每个数值列的最小值。

Pivot(Column)

透视当前数据帧的列并执行指定的聚合。

Pivot(Column, IEnumerable<Object>)

透视当前数据帧的列并执行指定的聚合。

Pivot(String)

透视当前数据帧的列并执行指定的聚合。

Pivot(String, IEnumerable<Object>)

透视当前数据帧的列并执行指定的聚合。

Sum(String[])

计算每个组的每个数值列的总和。

适用于