union

이 데이터 프레임과 다른 DataFrame의 행 조합이 포함된 새 DataFrame을 반환합니다.

문법

union(other: "DataFrame")

매개 변수

매개 변수 유형 설명
other DataFrame 통합해야 하는 또 다른 DataFrame입니다.

Returns

DataFrame: 해당 열이 있는 결합된 행을 포함하는 새 DataFrame입니다.

Notes

이 메서드는 요소의 자동 중복 제거 없이 두 DataFrame 개체의 행에 대한 SQL 스타일 집합 통합을 수행합니다.

메서드를 distinct() 사용하여 행 중복 제거를 수행합니다.

이 메서드는 SQL의 표준 동작에 따라 이름이 아닌 위치별로 열을 확인합니다.

예제

df1 = spark.createDataFrame([(1, 'A'), (2, 'B')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2)
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# |  1|    A|
# |  2|    B|
# |  3|    C|
# |  4|    D|
# +---+-----+

df1 = spark.createDataFrame([(1, 'A'), (2, 'B'), (3, 'C')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2).distinct().sort("id")
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# |  1|    A|
# |  2|    B|
# |  3|    C|
# |  4|    D|
# +---+-----+