json(DataStreamReader)

JSON 파일 스트림을 로드하고 결과를 DataFrame으로 반환합니다. JSON 줄(줄임표로 구분된 JSON)은 기본적으로 지원됩니다. 파일당 하나의 레코드가 있는 JSON의 multiLine 경우 옵션을 true.로 설정합니다. 지정하지 않으면 schema 입력 스키마가 데이터에서 유추됩니다.

문법

json(path, schema=None, **options)

매개 변수

매개 변수 유형 설명
path str JSON 데이터 세트의 경로입니다.
schema StructType 또는 str, 선택 사항 StructType 또는 DDL 형식 문자열로 스키마(예: col0 INT, col1 DOUBLE).

Returns

DataFrame

예제

임시 JSON 파일에서 스트림을 로드합니다.

import tempfile
import time
with tempfile.TemporaryDirectory(prefix="json") as d:
    spark.createDataFrame(
        [(100, "Hyukjin Kwon"),], ["age", "name"]
    ).write.mode("overwrite").format("json").save(d)
    q = spark.readStream.schema(
        "age INT, name STRING"
    ).json(d).writeStream.format("console").start()
    time.sleep(3)
    q.stop()