json (DataStreamReader)

Memuat aliran file JSON dan mengembalikan hasilnya sebagai DataFrame. JSON Lines (JSON yang dibatasi baris baru) didukung secara default. Untuk JSON dengan satu catatan per file, atur opsi ke multiLinetrue. Jika schema tidak ditentukan, skema input disimpulkan dari data.

Sintaksis

json(path, schema=None, **options)

Parameter-parameternya

Parameter Tipe Deskripsi
path str Jalur ke himpunan data JSON.
schema StructType atau str, opsional Skema sebagai string berformat StructType atau DDL (misalnya, col0 INT, col1 DOUBLE).

Pengembalian Barang

DataFrame

Examples

Muat aliran dari file JSON sementara:

import tempfile
import time
with tempfile.TemporaryDirectory(prefix="json") as d:
    spark.createDataFrame(
        [(100, "Hyukjin Kwon"),], ["age", "name"]
    ).write.mode("overwrite").format("json").save(d)
    q = spark.readStream.schema(
        "age INT, name STRING"
    ).json(d).writeStream.format("console").start()
    time.sleep(3)
    q.stop()