Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Devuelve la intersección de dos representaciones binarias de objetos Datasketches ThetaSketch, utilizando un objeto Intersección de Datasketches.
Syntax
from pyspark.sql import functions as sf
sf.theta_intersection(col1, col2)
Parámetros
| Parámetro | Tipo | Description |
|---|---|---|
col1 |
pyspark.sql.Column o str |
El primer croquis de Theta. |
col2 |
pyspark.sql.Column o str |
El segundo croquis de Theta. |
Devoluciones
pyspark.sql.Column: la representación binaria de la intersección ThetaSketch.
Examples
Ejemplo 1: Obtención de la intersección de dos bocetos de Theta
from pyspark.sql import functions as sf
df = spark.createDataFrame([(1,1),(2,2),(3,2),(3,3)], "struct<v1:int,v2:int>")
df = df.agg(
sf.theta_sketch_agg("v1").alias("sketch1"),
sf.theta_sketch_agg("v2").alias("sketch2")
)
df.select(sf.theta_sketch_estimate(sf.theta_intersection(df.sketch1, "sketch2"))).show()
+-----------------------------------------------------------+
|theta_sketch_estimate(theta_intersection(sketch1, sketch2))|
+-----------------------------------------------------------+
| 3|
+-----------------------------------------------------------+