birleşim

Bu ve başka bir DataFrame'deki satırların birleşimini içeren yeni bir DataFrame döndürür.

Sözdizimi

union(other: "DataFrame")

Parametreler

Parametre Türü Açıklama
other DataFrame Birleştirilmiş olması gereken başka bir DataFrame.

İadeler

DataFrame: Karşılık gelen sütunlara sahip birleştirilmiş satırları içeren yeni bir DataFrame.

Notlar

Bu yöntem, her iki DataFrame nesnedeki satırların SQL stili küme birleşimini gerçekleştirir ve öğelerin otomatik olarak yinelenenlerini kaldırmaz.

Satırların distinct() yinelenenleri kaldırma işlemini gerçekleştirmek için yöntemini kullanın.

yöntemi, SQL'deki standart davranışı izleyerek sütunları konuma göre (ada göre değil) çözümler.

Örnekler

df1 = spark.createDataFrame([(1, 'A'), (2, 'B')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2)
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# |  1|    A|
# |  2|    B|
# |  3|    C|
# |  4|    D|
# +---+-----+

df1 = spark.createDataFrame([(1, 'A'), (2, 'B'), (3, 'C')], ['id', 'value'])
df2 = spark.createDataFrame([(3, 'C'), (4, 'D')], ['id', 'value'])
df3 = df1.union(df2).distinct().sort("id")
df3.show()
# +---+-----+
# | id|value|
# +---+-----+
# |  1|    A|
# |  2|    B|
# |  3|    C|
# |  4|    D|
# +---+-----+