sjednocení

Vrátí nový datový rámec obsahující sjednocení řádků v tomto a jiném datovém rámci.

Syntaxe

union(other: "DataFrame")

Parametry

Parameter Typ Description
other Datový rámec Další datový rámec, který je potřeba sjednocovat.

Návraty

DataFrame: Nový datový rámec obsahující kombinované řádky s odpovídajícími sloupci.

Poznámky

Tato metoda provádí sjednocování řádků ve stylu SQL z obou DataFrame objektů bez automatického odstranění duplicit prvků.

Použijte metodu distinct() k odstranění duplicitních dat řádků.

Metoda přeloží sloupce podle pozice (nikoli podle názvu) za standardním chováním v SQL.

Příklady

df1 = spark.createDataFrame([(1, 'A'), (2, 'B')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2)
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# |  1|    A|
# |  2|    B|
# |  3|    C|
# |  4|    D|
# +---+-----+

df1 = spark.createDataFrame([(1, 'A'), (2, 'B'), (3, 'C')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2).distinct().sort("id")
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# |  1|    A|
# |  2|    B|
# |  3|    C|
# |  4|    D|
# +---+-----+