DataFrameWriter 类
定义
重要
一些信息与预发行产品相关,相应产品在发行之前可能会进行重大修改。 对于此处提供的信息,Microsoft 不作任何明示或暗示的担保。
用于将数据帧写入外部存储系统的接口 (,例如文件系统、键值存储等) 。
public sealed class DataFrameWriter
type DataFrameWriter = class
Public NotInheritable Class DataFrameWriter
- 继承
-
DataFrameWriter
方法
BucketBy(Int32, String, String[]) |
按给定列对输出进行桶存储。 如果指定,输出将布局在文件系统上,类似于 Hive 的存储桶方案。 |
Csv(String) |
将数据帧的内容保存为 CSV 格式的指定路径。 |
Format(String) |
指定基础输出数据源。 内置选项包括“parquet”、“json”等。 |
InsertInto(String) |
将 DataFrame 的内容插入到指定的表中。 它要求 DataFrame 的架构与表的架构相同。 |
Jdbc(String, String, Dictionary<String,String>) |
通过 JDBC 将数据帧的内容保存到外部数据库表 |
Json(String) |
将数据帧的内容以 JSON 格式保存在指定路径处。 |
Mode(SaveMode) |
指定数据或表已存在时的行为。 |
Mode(String) |
指定数据或表已存在时的行为。 |
Option(String, Boolean) |
添加基础数据源的输出选项。 |
Option(String, Double) |
添加基础数据源的输出选项。 |
Option(String, Int64) |
添加基础数据源的输出选项。 |
Option(String, String) |
添加基础数据源的输出选项。 |
Options(Dictionary<String,String>) |
添加基础数据源的输出选项。 |
Orc(String) |
将数据帧的内容以 ORC 格式保存在指定路径上。 |
Parquet(String) |
将数据帧的内容保存为 Parquet 格式的指定路径。 |
PartitionBy(String[]) |
按文件系统上的给定列对输出进行分区。 如果指定,输出将布局在文件系统上,类似于 Hive 的分区方案。 |
Save() |
将 DataFrame 的内容保存为指定的表。 |
Save(String) |
将 DataFrame 的内容保存在指定路径处。 |
SaveAsTable(String) |
将 DataFrame 的内容保存为指定的表。 |
SortBy(String, String[]) |
按给定列对每个存储桶中的输出进行排序。 |
Text(String) |
将数据帧的内容保存在指定路径的文本文件中。 |
适用于
反馈
https://aka.ms/ContentUserFeedback。
即将发布:在整个 2024 年,我们将逐步淘汰作为内容反馈机制的“GitHub 问题”,并将其取代为新的反馈系统。 有关详细信息,请参阅:提交和查看相关反馈