Megjegyzés
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhat bejelentkezni vagy módosítani a címtárat.
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhatja módosítani a címtárat.
Adjon vissza egy új DataFrame-et, amely tartalmazza az ebben és egy másik DataFrame-ben lévő sorok egyesítését.
Szemantika
union(other: "DataFrame")
Paraméterek
| Paraméter | Típus | Leírás |
|---|---|---|
other |
DataFrame | Egy másik adatkeret, amelyet egyesíteni kell. |
Visszatérítések
DataFrame: Egy új DataFrame, amely a megfelelő oszlopokkal rendelkező egyesített sorokat tartalmazza.
Jegyzetek
Ez a metódus sql-stílusú halmaz-egyesítést hajt végre mindkét DataFrame objektum soraiból, az elemek automatikus deduplikációja nélkül.
Használja a metódust a distinct() sorok deduplikációjának végrehajtásához.
A metódus az oszlopokat pozíció (nem név) alapján oldja fel, az SQL szokásos viselkedését követve.
Examples
df1 = spark.createDataFrame([(1, 'A'), (2, 'B')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2)
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# | 1| A|
# | 2| B|
# | 3| C|
# | 4| D|
# +---+-----+
df1 = spark.createDataFrame([(1, 'A'), (2, 'B'), (3, 'C')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2).distinct().sort("id")
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# | 1| A|
# | 2| B|
# | 3| C|
# | 4| D|
# +---+-----+