Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Mengembalikan persimpangan dua representasi biner objek Datasketches ThetaSketch, menggunakan objek Persimpangan Datasketches.
Syntax
from pyspark.sql import functions as sf
sf.theta_intersection(col1, col2)
Parameter-parameternya
| Pengaturan | Tipe | Description |
|---|---|---|
col1 |
pyspark.sql.Column atau str |
Sketsa Theta pertama. |
col2 |
pyspark.sql.Column atau str |
Sketsa Theta kedua. |
Pengembalian Barang
pyspark.sql.Column: Representasi biner dari ThetaSketch yang berpotongan.
Examples
Contoh 1: Dapatkan persimpangan dua sketsa Theta
from pyspark.sql import functions as sf
df = spark.createDataFrame([(1,1),(2,2),(3,2),(3,3)], "struct<v1:int,v2:int>")
df = df.agg(
sf.theta_sketch_agg("v1").alias("sketch1"),
sf.theta_sketch_agg("v2").alias("sketch2")
)
df.select(sf.theta_sketch_estimate(sf.theta_intersection(df.sketch1, "sketch2"))).show()
+-----------------------------------------------------------+
|theta_sketch_estimate(theta_intersection(sketch1, sketch2))|
+-----------------------------------------------------------+
| 3|
+-----------------------------------------------------------+