Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Область применения:
Databricks Runtime 18.1 и выше
Объединение нескольких двоичных представлений TupleSketch с двойными сводками в один объединенный эскиз. Используйте эту функцию для объединения предварительно агрегированных эскизов из разных разделов или источников данных.
Синтаксис
tuple_union_agg_double ( sketch [, lgNomEntries [, mode ]] )
Аргументы
- эскиз: TupleSketch в двоичном формате с двойными сводками (например, из tuple_sketch_agg_double).
-
lgNomEntries: необязательный
INTEGERлитерал, указывающий log-base-2 номинальных записей для объединения. Должно быть от 4 до 26 включительно. Значение по умолчанию — 12. -
режим. Необязательный
STRINGлитерал, указывающий режим агрегирования для объединения повторяющихся сводок ключей. Допустимые значения:'sum','min','max','alwaysone'. Значение по умолчанию —'sum'.
Возвраты
BINARY Значение, содержащее объединенный TupleSketch с двойными сводками.
Примечания.
-
NULLвходные эскизы игнорируются во время агрегирования. - Операция объединения объединяет эскизы, даже если они имеют разные значения lgNomEntries.
- Для объединения всего двух эскизов используйте скалярную tuple_union_double функцию.
Сообщения об ошибках
Примеры
-- Union sketches from different partitions
> SELECT tuple_sketch_estimate_double(tuple_union_agg_double(sketch)) FROM (
SELECT tuple_sketch_agg_double(key, summary) as sketch FROM VALUES (1, 5.0D), (2, 10.0D) tab(key, summary)
UNION ALL
SELECT tuple_sketch_agg_double(key, summary) as sketch FROM VALUES (2, 3.0D), (3, 7.0D) tab(key, summary)
);
3.0