teks (DataFrameReader)

Memuat file teks dan mengembalikan DataFrame skema yang dimulai dengan kolom string bernama value, diikuti oleh kolom yang dipartisi jika ada. File teks harus dikodekan sebagai UTF-8. Secara default, setiap baris dalam file teks adalah baris baru dalam DataFrame yang dihasilkan.

Sintaksis

text(paths, wholetext=False, lineSep=None, **options)

Parameter-parameternya

Parameter Tipe Deskripsi
paths str atau daftar Satu atau beberapa jalur input.
wholetext bool, opsional Jika True, baca setiap file sebagai satu baris. Defaultnya adalah False.
lineSep str, opsional Pemisah garis yang akan digunakan. Defaultnya adalah '\n', '\r', atau '\r\n'.

Pengembalian Barang

DataFrame

Examples

Tulis DataFrame ke dalam file teks dan baca kembali.

import tempfile
with tempfile.TemporaryDirectory(prefix="text") as d:
    df = spark.createDataFrame([("a",), ("b",), ("c",)], schema=["alphabets"])
    df.write.mode("overwrite").format("text").save(d)

    spark.read.schema(df.schema).text(d).sort("alphabets").show()
    # +---------+
    # |alphabets|
    # +---------+
    # |        a|
    # |        b|
    # |        c|
    # +---------+