Notatka
Dostęp do tej strony wymaga autoryzacji. Może spróbować zalogować się lub zmienić katalogi.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Zwróć nową ramkę danych zawierającą połączenie wierszy w tym i innej ramce danych.
Składnia
union(other: "DataFrame")
Parametry
| Parameter | Typ | Opis |
|---|---|---|
other |
Ramka danych | Kolejna ramka danych, która musi być zjednoczone. |
Zwroty
DataFrame: nowa ramka danych zawierająca połączone wiersze z odpowiednimi kolumnami.
Notatki
Ta metoda wykonuje połączenie zestawu w stylu SQL wierszy z obu DataFrame obiektów bez automatycznej deduplikacji elementów.
distinct() Użyj metody , aby przeprowadzić deduplikację wierszy.
Metoda rozpoznaje kolumny według pozycji (a nie według nazwy), zgodnie ze standardowym zachowaniem w języku SQL.
Examples
df1 = spark.createDataFrame([(1, 'A'), (2, 'B')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2)
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# | 1| A|
# | 2| B|
# | 3| C|
# | 4| D|
# +---+-----+
df1 = spark.createDataFrame([(1, 'A'), (2, 'B'), (3, 'C')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2).distinct().sort("id")
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# | 1| A|
# | 2| B|
# | 3| C|
# | 4| D|
# +---+-----+