Note
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de changer d’annuaire.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de changer d’annuaire.
Marque un DataFrame comme suffisamment petit pour une utilisation dans les jointures de diffusion. Prend en charge Spark Connect.
Syntaxe
from pyspark.databricks.sql import functions as dbf
dbf.broadcast(df=<df>)
Paramètres
| Paramètre | Type | Descriptif |
|---|---|---|
df |
pyspark.sql.DataFrame |
DataFrame à marquer comme prêt pour la jointure de diffusion. |
Retours
pyspark.sql.DataFrame: DataFrame marqué comme prêt pour la jointure de diffusion.
Examples
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([1, 2, 3, 3, 4], "int")
df_small = spark.range(3)
df_b = dbf.broadcast(df_small)
df.join(df_b, df.value == df_small.id).show()
+-----+---+
|value| id|
+-----+---+
| 1| 1|
| 2| 2|
+-----+---+