將內容 DataFrame 儲存到資料來源。 資料來源由 format 和 一組 options指定。 若 format 未指定,則使用預設的 spark.sql.sources.default 設定資料來源。
語法
save(path=None, format=None, mode=None, partitionBy=None, **options)
參數
| 參數 | 類型 | 說明 |
|---|---|---|
path |
力量,選用 | Hadoop 支援的檔案系統中的路徑。 |
format |
力量,選用 | 過去的格式是用來儲存的。 |
mode |
力量,選用 | 當資料已經存在時的行為。 接受的值為 'append'、 'overwrite'、 'ignore'、 'error' 或 'errorifexists' (預設值)。 |
partitionBy |
清單,選用 | 分割欄位名稱。 |
**options |
dict | 額外的弦線選擇。 |
退貨
沒有
Examples
把 DataFrame 寫進 JSON 檔案,然後讀回來。
import tempfile
with tempfile.TemporaryDirectory(prefix="save") as d:
spark.createDataFrame(
[{"age": 100, "name": "Alice"}]
).write.mode("overwrite").format("json").save(d)
spark.read.format('json').load(d).show()
# +---+------------+
# |age| name|
# +---+------------+
# |100|Alice|
# +---+------------+