데이터 원본에서 데이터 스트림을 로드하고 데이터 프레임으로 반환합니다.
문법
load(path=None, format=None, schema=None, **options)
매개 변수
| 매개 변수 | 유형 | 설명 |
|---|---|---|
path |
str, 선택 사항 | 파일 시스템 지원 데이터 원본에 대한 경로입니다. |
format |
str, 선택 사항 | 데이터 원본의 형식입니다. 기본값은 'parquet'입니다. |
schema |
StructType 또는 str, 선택 사항 | 입력 데이터에 대한 스키마를 StructType 또는 DDL 형식 문자열로 지정합니다(예: col0 INT, col1 DOUBLE). |
**options |
다른 모든 문자열 옵션입니다. |
Returns
DataFrame
예제
임시 JSON 파일에서 스트림을 로드합니다.
import tempfile
import time
with tempfile.TemporaryDirectory(prefix="load") as d:
spark.createDataFrame(
[(100, "Hyukjin Kwon"),], ["age", "name"]
).write.mode("overwrite").format("json").save(d)
q = spark.readStream.schema(
"age INT, name STRING"
).format("json").load(d).writeStream.format("console").start()
time.sleep(3)
q.stop()