DataFrame.Repartition 方法
定义
重要
一些信息与预发行产品相关,相应产品在发行之前可能会进行重大修改。 对于此处提供的信息,Microsoft 不作任何明示或暗示的担保。
重载
Repartition(Int32, Column[]) |
将给定分区表达式分区的新 |
Repartition(Int32) |
返回一个刚 |
Repartition(Column[]) |
返回由给定分区表达式分区的新 |
Repartition(Int32, Column[])
将给定分区表达式分区的新 DataFrame
返回到 numPartitions
中。 生成的 DataFrame
是哈希分区。
public Microsoft.Spark.Sql.DataFrame Repartition (int numPartitions, params Microsoft.Spark.Sql.Column[] partitionExprs);
member this.Repartition : int * Microsoft.Spark.Sql.Column[] -> Microsoft.Spark.Sql.DataFrame
Public Function Repartition (numPartitions As Integer, ParamArray partitionExprs As Column()) As DataFrame
参数
- numPartitions
- Int32
分区数
- partitionExprs
- Column[]
分区表达式
返回
DataFrame 对象
适用于
Repartition(Int32)
Repartition(Column[])
返回由给定分区表达式分区的新 DataFrame
,使用 spark.sql.shuffle.partitions
作为分区数。
public Microsoft.Spark.Sql.DataFrame Repartition (params Microsoft.Spark.Sql.Column[] partitionExprs);
member this.Repartition : Microsoft.Spark.Sql.Column[] -> Microsoft.Spark.Sql.DataFrame
Public Function Repartition (ParamArray partitionExprs As Column()) As DataFrame
参数
- partitionExprs
- Column[]
分区表达式
返回
DataFrame 对象
适用于
反馈
https://aka.ms/ContentUserFeedback。
即将发布:在整个 2024 年,我们将逐步淘汰作为内容反馈机制的“GitHub 问题”,并将其取代为新的反馈系统。 有关详细信息,请参阅:提交和查看相关反馈