원본 테이블을 기반으로 하는 업데이트, 삽입 및 삭제 집합을 대상 테이블에 병합합니다.
문법
mergeInto(table: str, condition: Column)
매개 변수
| 매개 변수 | 유형 | 설명 |
|---|---|---|
table |
str | 병합할 대상 테이블 이름입니다. |
condition |
칼럼 | 대상 테이블의 행이 원본 DataFrame의 행과 일치하는지 여부를 결정하는 조건입니다. |
Returns
MergeIntoWriter: MergeIntoWriter를 사용하여 원본 DataFrame을 대상 테이블에 병합하는 방법을 지정합니다.
예제
from pyspark.sql.functions import expr
source = spark.createDataFrame(
[(14, "Tom"), (23, "Alice"), (16, "Bob")], ["id", "name"])
(source.mergeInto("target", "id")
.whenMatched().update({ "name": source.name })
.whenNotMatched().insertAll()
.whenNotMatchedBySource().delete()
.merge())