Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Memuat file teks dan mengembalikan DataFrame skema yang dimulai dengan kolom string bernama value, diikuti oleh kolom yang dipartisi jika ada. File teks harus dikodekan sebagai UTF-8. Secara default, setiap baris dalam file teks adalah baris baru dalam DataFrame yang dihasilkan.
Sintaksis
text(paths, wholetext=False, lineSep=None, **options)
Parameter-parameternya
| Parameter | Tipe | Deskripsi |
|---|---|---|
paths |
str atau daftar | Satu atau beberapa jalur input. |
wholetext |
bool, opsional | Jika True, baca setiap file sebagai satu baris. Defaultnya adalah False. |
lineSep |
str, opsional | Pemisah garis yang akan digunakan. Defaultnya adalah '\n', '\r', atau '\r\n'. |
Pengembalian Barang
DataFrame
Examples
Tulis DataFrame ke dalam file teks dan baca kembali.
import tempfile
with tempfile.TemporaryDirectory(prefix="text") as d:
df = spark.createDataFrame([("a",), ("b",), ("c",)], schema=["alphabets"])
df.write.mode("overwrite").format("text").save(d)
spark.read.schema(df.schema).text(d).sort("alphabets").show()
# +---------+
# |alphabets|
# +---------+
# | a|
# | b|
# | c|
# +---------+