Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Gilt für:
Databricks Runtime 18.1 und höher
Erstellt ein Datasketches TupleSketch aus Schlüssel-Wert-Paaren, bei denen Schlüssel für unterschiedliche Zähl- und ganzzahlige Zusammenfassungswerte gemäß dem angegebenen Modus aggregiert werden.
Syntax
tuple_sketch_agg_integer ( key, summary [, lgNomEntries [, mode ]] )
Argumente
-
key: Der Ausdruck für die Zählung eindeutiger Werte. Akzeptierte Typen sind
INTEGER,LONG,FLOAT,DOUBLE,STRING,BINARY, undARRAY<LONG>ARRAY<INTEGER>. -
zusammenfassung: Ein
INTEGERWert, der für jeden Schlüssel zugeordnet und aggregiert werden soll. -
lgNomEntries: Ein optionales
INTEGERLiteral, das die Log-Base-2 von Nominaleinträgen angibt. Muss zwischen 4 und 26 einschließlich liegen. Der Standardwert ist 12 (4.096 Buckets). Höhere Werte bieten eine bessere Genauigkeit, verwenden aber mehr Arbeitsspeicher. -
modus: Ein optionales
STRINGLiteral, das den Aggregationsmodus für Zusammenfassungen angibt. Gültige Werte:'sum','min','max','alwaysone'. Der Standardwert lautet'sum'.
Rückkehr
Ein BINARY Wert, der den serialisierten kompakten TupleSketch mit ganzzahligen Zusammenfassungen enthält.
Hinweise
-
NULLSchlüssel- oder Zusammenfassungswerte werden während der Aggregation ignoriert. - Leere Zeichenfolgen, leere Bytearrays und leere Arrays werden für Schlüssel ignoriert.
- Die
lgNomEntriesWerte undmodeParameter müssen Konstantenwerte sein. - Verwenden Sie tuple_sketch_estimate_integer , um die unterschiedliche Anzahl zu erhalten.
- Verwenden Sie tuple_sketch_summary_integer , um den aggregierten Zusammenfassungswert abzurufen.
Fehlermeldungen
Beispiele
-- Create sketch and get distinct count estimate
> SELECT tuple_sketch_estimate_integer(tuple_sketch_agg_integer(key, summary)) FROM VALUES (1, 5), (1, 1), (2, 2), (2, 3), (3, 2) tab(key, summary);
3.0
-- Get aggregated summary (sum mode by default)
> SELECT tuple_sketch_summary_integer(tuple_sketch_agg_integer(key, summary)) FROM VALUES (1, 1), (1, 2), (2, 3) tab(key, summary);
6