DataFrame.RepartitionByRange 方法

定义

重要

一些信息与预发行产品相关，相应产品在发行之前可能会进行重大修改。对于此处提供的信息，Microsoft 不作任何明示或暗示的担保。

RepartitionByRange(Column[])	返回由给定分区表达式分区的新 `DataFrame` ，使用 `spark.sql.shuffle.partitions` 作为分区数。生成的数据集已分区区域。
RepartitionByRange(Int32, Column[])	将给定分区表达式分区的新 `DataFrame` 返回到中 `numPartitions`。生成的 `DataFrame` 是已分区范围。

返回由给定分区表达式分区的新 DataFrame ，使用 spark.sql.shuffle.partitions 作为分区数。生成的数据集已分区区域。

public Microsoft.Spark.Sql.DataFrame RepartitionByRange(params Microsoft.Spark.Sql.Column[] partitionExprs);

member this.RepartitionByRange : Microsoft.Spark.Sql.Column[] -> Microsoft.Spark.Sql.DataFrame

Public Function RepartitionByRange (ParamArray partitionExprs As Column()) As DataFrame

分区表达式

DataFrame 对象

将给定分区表达式分区的新 DataFrame 返回到中 numPartitions。生成的 DataFrame 是已分区范围。

public Microsoft.Spark.Sql.DataFrame RepartitionByRange(int numPartitions, params Microsoft.Spark.Sql.Column[] partitionExprs);

member this.RepartitionByRange : int * Microsoft.Spark.Sql.Column[] -> Microsoft.Spark.Sql.DataFrame

Public Function RepartitionByRange (numPartitions As Integer, ParamArray partitionExprs As Column()) As DataFrame

分区数

分区表达式

DataFrame 对象