Nota
O acceso a esta páxina require autorización. Pode tentar iniciar sesión ou modificar os directorios.
O acceso a esta páxina require autorización. Pode tentar modificar os directorios.
Devuelve la intersección de dos representaciones binarias de objetos Datasketches Theta Sketch, utilizando un objeto Intersección de Datasketches.
Syntax
from pyspark.sql import functions as sf
sf.theta_intersection(col1, col2)
Parámetros
| Parámetro | Tipo | Description |
|---|---|---|
col1 |
pyspark.sql.Column o str |
El primer croquis de Theta. |
col2 |
pyspark.sql.Column o str |
El segundo croquis de Theta. |
Devoluciones
pyspark.sql.Column: representación binaria de la intersección Theta Sketch.
Examples
Ejemplo 1: Obtención de la intersección de dos bocetos de Theta
from pyspark.sql import functions as sf
df = spark.createDataFrame([(1,1),(2,2),(3,2),(3,3)], "struct<v1:int,v2:int>")
df = df.agg(
sf.theta_sketch_agg("v1").alias("sketch1"),
sf.theta_sketch_agg("v2").alias("sketch2")
)
df.select(sf.theta_sketch_estimate(sf.theta_intersection(df.sketch1, "sketch2"))).show()
+-----------------------------------------------------------+
|theta_sketch_estimate(theta_intersection(sketch1, sketch2))|
+-----------------------------------------------------------+
| 3|
+-----------------------------------------------------------+