Diffusion

Marque un DataFrame comme suffisamment petit pour une utilisation dans les jointures de diffusion. Prend en charge Spark Connect.

Syntaxe

from pyspark.databricks.sql import functions as dbf

dbf.broadcast(df=<df>)

Paramètres

Paramètre	Type	Descriptif
`df`	`pyspark.sql.DataFrame`	DataFrame à marquer comme prêt pour la jointure de diffusion.

Retours

pyspark.sql.DataFrame: DataFrame marqué comme prêt pour la jointure de diffusion.

Examples

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([1, 2, 3, 3, 4], "int")
df_small = spark.range(3)
df_b = dbf.broadcast(df_small)
df.join(df_b, df.value == df_small.id).show()

+-----+---+
|value| id|
+-----+---+
|    1|  1|
|    2|  2|
+-----+---+

Rétroaction

Cette page a-t-elle été utile ?

Last updated on 2026-02-01