Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Zwraca skrzyżowanie dwóch binarnych reprezentacji obiektów Datasketches Theta Sketch przy użyciu obiektu Datasketches Intersection.
Składnia
from pyspark.sql import functions as sf
sf.theta_intersection(col1, col2)
Parametry
| Parameter | Typ | Description |
|---|---|---|
col1 |
pyspark.sql.Column lub str |
Pierwszy szkic Theta. |
col2 |
pyspark.sql.Column lub str |
Drugi szkic Theta. |
Zwraca
pyspark.sql.Column: binarna reprezentacja przeciętego szkicu Theta.
Przykłady
Przykład 1: Uzyskiwanie skrzyżowania dwóch szkiców Theta
from pyspark.sql import functions as sf
df = spark.createDataFrame([(1,1),(2,2),(3,2),(3,3)], "struct<v1:int,v2:int>")
df = df.agg(
sf.theta_sketch_agg("v1").alias("sketch1"),
sf.theta_sketch_agg("v2").alias("sketch2")
)
df.select(sf.theta_sketch_estimate(sf.theta_intersection(df.sketch1, "sketch2"))).show()
+-----------------------------------------------------------+
|theta_sketch_estimate(theta_intersection(sketch1, sketch2))|
+-----------------------------------------------------------+
| 3|
+-----------------------------------------------------------+