katıl

Verilen birleştirme ifadesini kullanarak başka bir DataFrame ile birleşir.

Sözdizimi

join(other: "DataFrame", on: Optional[Union[str, List[str], Column, List[Column]]] = None, how: Optional[str] = None)

Parametreler

Parametre Türü Açıklama
other DataFrame Birleştirmenin sağ tarafı.
on str, list veya Column, isteğe bağlı birleştirme sütun adı, sütun adları listesi, birleştirme ifadesi (Sütun) veya Sütunlar listesi için bir dize. Birleştirme sütunlarının adını gösteren bir dize veya dize listesiyse on , sütunların her iki tarafta da bulunması gerekir ve bu bir eş birleşim gerçekleştirir.
how str, isteğe bağlı varsayılan innerdeğeridir. Bunlardan biri olmalıdır: , , , , inner, cross, outer, , full, fullouter, full_outerleftleftouterleft_outerrightrightouterright_outersemileftsemive .left_semiantileftantileft_anti

İadeler

DataFrame: Birleştirilmiş DataFrame.

Örnekler

import pyspark.sql.functions as sf
from pyspark.sql import Row
df = spark.createDataFrame([Row(name="Alice", age=2), Row(name="Bob", age=5)])
df2 = spark.createDataFrame([Row(name="Tom", height=80), Row(name="Bob", height=85)])

df.join(df2, "name").show()
# +----+---+------+
# |name|age|height|
# +----+---+------+
# | Bob|  5|    85|
# +----+---+------+

joined = df.join(df2, df.name == df2.name, "outer").sort(sf.desc(df.name))
joined.show()
# +-----+----+----+------+
# | name| age|name|height|
# +-----+----+----+------+
# |  Bob|   5| Bob|    85|
# |Alice|   2|NULL|  NULL|
# | NULL|NULL| Tom|    80|
# +-----+----+----+------+

df.alias("a").join(
    df.alias("b"), sf.col("a.name") == sf.col("b.name"), "outer"
).sort(sf.desc("a.name")).select("a.name", "b.age").show()
# +-----+---+
# | name|age|
# +-----+---+
# |  Bob|  5|
# |Alice|  2|
# +-----+---+