검사점 진화를 위해 스트리밍 원본에 이름을 할당합니다. 이렇게 하면 검사점 호환성을 손상하지 않고 원본의 순서를 변경하거나 추가할 수 있도록 하여 스트리밍 쿼리가 진화할 수 있습니다. 원본 진화를 사용하도록 설정하면 쿼리의 모든 원본의 이름을 지정해야 합니다.
문법
name(source_name)
매개 변수
| 매개 변수 | 유형 | 설명 |
|---|---|---|
source_name |
str | 이 스트리밍 원본의 이름입니다. ASCII 문자(a-z, A-Z), 숫자(0-9) 및 밑줄(_)만 포함해야 합니다. |
Returns
DataStreamReader
Notes
구성을 통해 spark.sql.streaming.enableSourceEvolution 스트리밍 원본 진화를 사용하도록 설정해야 합니다.
예제
두 원본의 이름을 지정하고 통합합니다.
df1 = spark.readStream.format("rate").name("source1").load()
df2 = spark.readStream.format("rate").name("source2").load()
query = df1.union(df2).writeStream.format("console").start()
유효하고 잘못된 원본 이름:
# Valid names
spark.readStream.format("rate").name("mySource").load()
spark.readStream.format("rate").name("my_source_123").load()
# Invalid name — raises AnalysisException
spark.readStream.format("rate").name("my-source").load()