文字(DataFrameReader)

載入文字檔並回傳 , DataFrame 其結構以字 value串欄位 為 開頭,若有分割欄位,則接著。 文字檔必須編碼為 UTF-8。 預設情況下,文字檔中的每一行都是結果資料框中的一列新資料。

語法

text(paths, wholetext=False, lineSep=None, **options)

參數

參數 類型 說明
paths 力量或列表 一條或多條輸入路徑。
wholetext Bool,選用 True,則將每個檔案讀取為一列。 預設值為 False
lineSep 力量,選用 使用線分器。 預設為 '\n''\r''\r\n'

退貨

DataFrame

Examples

將資料框寫入文字檔並讀取。

import tempfile
with tempfile.TemporaryDirectory(prefix="text") as d:
    df = spark.createDataFrame([("a",), ("b",), ("c",)], schema=["alphabets"])
    df.write.mode("overwrite").format("text").save(d)

    spark.read.schema(df.schema).text(d).sort("alphabets").show()
    # +---------+
    # |alphabets|
    # +---------+
    # |        a|
    # |        b|
    # |        c|
    # +---------+