Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Область применения:
Databricks Runtime 18.1 и выше
Объединяет несколько двоичных представлений TupleSketch с целыми сводками в один объединенный эскиз. Используйте эту функцию для объединения предварительно агрегированных эскизов из разных разделов или источников данных.
Синтаксис
tuple_union_agg_integer ( sketch [, lgNomEntries [, mode ]] )
Аргументы
- эскиз: TupleSketch в двоичном формате с целыми сводные данные (например, из tuple_sketch_agg_integer).
-
lgNomEntries: необязательный
INTEGERлитерал, указывающий log-base-2 номинальных записей для объединения. Должно быть от 4 до 26 включительно. Значение по умолчанию — 12. -
режим. Необязательный
STRINGлитерал, указывающий режим агрегирования для объединения повторяющихся сводок ключей. Допустимые значения:'sum','min','max','alwaysone'. Значение по умолчанию —'sum'.
Возвраты
Значение BINARY , содержащее объединенный TupleSketch с целыми сводками.
Примечания.
-
NULLвходные эскизы игнорируются во время агрегирования. - Операция объединения объединяет эскизы, даже если они имеют разные значения lgNomEntries.
- Для объединения ровно двух эскизов используйте скалярную tuple_union_integer функцию.
Сообщения об ошибках
Примеры
-- Union sketches from different partitions
> SELECT tuple_sketch_estimate_integer(tuple_union_agg_integer(sketch)) FROM (
SELECT tuple_sketch_agg_integer(key, summary) as sketch FROM VALUES (1, 5), (2, 10) tab(key, summary)
UNION ALL
SELECT tuple_sketch_agg_integer(key, summary) as sketch FROM VALUES (2, 3), (3, 7) tab(key, summary)
);
3.0