Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Memuat aliran file JSON dan mengembalikan hasilnya sebagai DataFrame. JSON Lines (JSON yang dibatasi baris baru) didukung secara default. Untuk JSON dengan satu catatan per file, atur opsi ke multiLinetrue. Jika schema tidak ditentukan, skema input disimpulkan dari data.
Sintaksis
json(path, schema=None, **options)
Parameter-parameternya
| Parameter | Tipe | Deskripsi |
|---|---|---|
path |
str | Jalur ke himpunan data JSON. |
schema |
StructType atau str, opsional | Skema sebagai string berformat StructType atau DDL (misalnya, col0 INT, col1 DOUBLE). |
Pengembalian Barang
DataFrame
Examples
Muat aliran dari file JSON sementara:
import tempfile
import time
with tempfile.TemporaryDirectory(prefix="json") as d:
spark.createDataFrame(
[(100, "Hyukjin Kwon"),], ["age", "name"]
).write.mode("overwrite").format("json").save(d)
q = spark.readStream.schema(
"age INT, name STRING"
).json(d).writeStream.format("console").start()
time.sleep(3)
q.stop()