DataFrameWriter 类

定义

用于将数据帧写入外部存储系统的接口 (,例如文件系统、键值存储等) 。

public sealed class DataFrameWriter
type DataFrameWriter = class
Public NotInheritable Class DataFrameWriter
继承
DataFrameWriter

方法

BucketBy(Int32, String, String[])

按给定列对输出进行桶存储。 如果指定,输出将布局在文件系统上,类似于 Hive 的存储桶方案。

Csv(String)

将数据帧的内容保存为 CSV 格式的指定路径。

Format(String)

指定基础输出数据源。 内置选项包括“parquet”、“json”等。

InsertInto(String)

将 DataFrame 的内容插入到指定的表中。 它要求 DataFrame 的架构与表的架构相同。

Jdbc(String, String, Dictionary<String,String>)

通过 JDBC 将数据帧的内容保存到外部数据库表

Json(String)

将数据帧的内容以 JSON 格式保存在指定路径处。

Mode(SaveMode)

指定数据或表已存在时的行为。

Mode(String)

指定数据或表已存在时的行为。

Option(String, Boolean)

添加基础数据源的输出选项。

Option(String, Double)

添加基础数据源的输出选项。

Option(String, Int64)

添加基础数据源的输出选项。

Option(String, String)

添加基础数据源的输出选项。

Options(Dictionary<String,String>)

添加基础数据源的输出选项。

Orc(String)

将数据帧的内容以 ORC 格式保存在指定路径上。

Parquet(String)

将数据帧的内容保存为 Parquet 格式的指定路径。

PartitionBy(String[])

按文件系统上的给定列对输出进行分区。 如果指定,输出将布局在文件系统上,类似于 Hive 的分区方案。

Save()

将 DataFrame 的内容保存为指定的表。

Save(String)

将 DataFrame 的内容保存在指定路径处。

SaveAsTable(String)

将 DataFrame 的内容保存为指定的表。

SortBy(String, String[])

按给定列对每个存储桶中的输出进行排序。

Text(String)

将数据帧的内容保存在指定路径的文本文件中。

适用于