Поделиться через


Трансляции

Помечает DataFrame как достаточно маленький для использования в широковещательных соединениях. Поддерживает Spark Connect.

Синтаксис

from pyspark.databricks.sql import functions as dbf

dbf.broadcast(df=<df>)

Параметры

Параметр Тип Description
df pyspark.sql.DataFrame Кадр данных, который помечается как готовый для вещания соединения.

Возвраты

pyspark.sql.DataFrame: Кадр данных, помеченный как готовый для вещания соединения.

Примеры

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([1, 2, 3, 3, 4], "int")
df_small = spark.range(3)
df_b = dbf.broadcast(df_small)
df.join(df_b, df.value == df_small.id).show()
+-----+---+
|value| id|
+-----+---+
|    1|  1|
|    2|  2|
+-----+---+