Share via


collect_set (función de agregado)

Se aplica a:casilla marcada como Sí Databricks SQL casilla marcada como Sí Databricks Runtime

Devuelve una matriz que contiene todos los valores únicos de expr dentro del grupo.

Sintaxis

collect_set(expr) [FILTER ( WHERE cond ) ]

Esta función también se puede invocar como una función de ventana mediante la cláusula OVER.

Argumentos

  • expr: una expresión de cualquier tipo excepto MAP.
  • cond: una expresión booleana opcional que filtra las filas usadas para la agregación.

Devoluciones

Una matriz del tipo de argumento.

El orden de los elementos de la matriz no es determinista. Se excluyen los valores NULL.

Ejemplos

> SELECT collect_set(col) FROM VALUES (1), (2), (NULL), (1) AS tab(col);
 [1,2]

> SELECT collect_set(col1) FILTER(WHERE col2 = 10)
    FROM VALUES (1, 10), (2, 10), (NULL, 10), (1, 10), (3, 12) AS tab(col1, col2);
 [1,2]