start(DataStreamWriter)

DataFrame의 내용을 데이터 원본으로 스트리밍하고 StreamingQuery 개체를 반환합니다.

문법

start(path=None, format=None, outputMode=None, partitionBy=None, queryName=None, **options)

매개 변수

매개 변수 유형 설명
path str, 선택 사항 Hadoop 지원 파일 시스템의 경로입니다.
format str, 선택 사항 저장하는 데 사용되는 형식입니다.
outputMode str, 선택 사항 싱크에 데이터를 쓰는 방법: append, complete또는 update.
partitionBy str 또는 list, 선택 사항 분할 열의 이름입니다.
queryName str, 선택 사항 쿼리의 고유 이름입니다.
**options
다른 모든 문자열 옵션입니다. 스트림에 필요하지 않은 대부분의 스트림을 checkpointLocation 제공합니다memory.

Returns

StreamingQuery

예제

df = spark.readStream.format("rate").load()

기본 예제:

q = df.writeStream.format('memory').queryName('this_query').start()
q.isActive
# True
q.name
# 'this_query'
q.stop()
q.isActive
# False

트리거 및 추가 매개 변수 사용:

q = df.writeStream.trigger(processingTime='5 seconds').start(
    queryName='that_query', outputMode="append", format='memory')
q.name
# 'that_query'
q.isActive
# True
q.stop()