Condividi tramite


theta_intersection_agg funzione di aggregazione

Si applica a:check contrassegnato come sì controllo SQL di Databricks contrassegnato come sì Databricks Runtime 18.0 e versioni successive

Utilizza più buffer di Sketch Theta e li interseca in un unico buffer dei risultati. Restituisce il conteggio approssimativo di valori distinti visualizzati in tutti gli schizzi di input.

Sintassi

theta_intersection_agg ( sketch )

Arguments

Restituzioni

Valore BINARY contenente l'oggetto Theta Sketch serializzato che rappresenta l'intersezione di tutti gli schizzi di input.

Note

  • NULL i valori vengono ignorati durante l'aggregazione.
  • Il risultato dell'intersezione rappresenta i valori visualizzati in tutti gli schizzi di input.
  • Per intersecare esattamente due schizzi, usare invece la funzione funzione scalaretheta_intersection.

Messaggi di errore

Esempi

-- Find approximate count of values appearing in all sketches
> SELECT theta_sketch_estimate(theta_intersection_agg(sketch)) FROM (
    SELECT theta_sketch_agg(col) AS sketch FROM VALUES (1), (2), (3) AS tab(col)
    UNION ALL
    SELECT theta_sketch_agg(col) AS sketch FROM VALUES (2), (3), (4) AS tab(col)
    UNION ALL
    SELECT theta_sketch_agg(col) AS sketch FROM VALUES (3), (4), (5) AS tab(col)
  ) t;
1