Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Vrátí nový datový rámec obsahující sjednocení řádků v tomto a jiném datovém rámci.
Syntaxe
union(other: "DataFrame")
Parametry
| Parameter | Typ | Description |
|---|---|---|
other |
Datový rámec | Další datový rámec, který je potřeba sjednocovat. |
Návraty
DataFrame: Nový datový rámec obsahující kombinované řádky s odpovídajícími sloupci.
Poznámky
Tato metoda provádí sjednocování řádků ve stylu SQL z obou DataFrame objektů bez automatického odstranění duplicit prvků.
Použijte metodu distinct() k odstranění duplicitních dat řádků.
Metoda přeloží sloupce podle pozice (nikoli podle názvu) za standardním chováním v SQL.
Příklady
df1 = spark.createDataFrame([(1, 'A'), (2, 'B')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2)
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# | 1| A|
# | 2| B|
# | 3| C|
# | 4| D|
# +---+-----+
df1 = spark.createDataFrame([(1, 'A'), (2, 'B'), (3, 'C')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2).distinct().sort("id")
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# | 1| A|
# | 2| B|
# | 3| C|
# | 4| D|
# +---+-----+