mergeInto

Sloučí sadu aktualizací, vložení a odstranění na základě zdrojové tabulky do cílové tabulky.

Syntaxe

mergeInto(table: str, condition: Column)

Parametry

Parameter Typ Description
table str Název cílové tabulky, do které se má sloučit.
condition Sloupec Podmínka, která určuje, jestli řádek v cílové tabulce odpovídá řádku ve zdrojovém datovém rámci.

Návraty

MergeIntoWriter: MergeIntoWriter použít dále k určení, jak sloučit zdrojový datový rámec do cílové tabulky.

Příklady

from pyspark.sql.functions import expr
source = spark.createDataFrame(
    [(14, "Tom"), (23, "Alice"), (16, "Bob")], ["id", "name"])
(source.mergeInto("target", "id")
    .whenMatched().update({ "name": source.name })
    .whenNotMatched().insertAll()
    .whenNotMatchedBySource().delete()
    .merge())