Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Função de agregação
Aplica-se a:
Databricks Runtime 18.1 e superior
Calcula a média de vetores em termos de elemento em uma agregação. Retorna um vetor em que cada elemento é a média aritmética dos elementos correspondentes em todos os vetores de entrada.
Sintaxe
vector_avg(vectors) [FILTER ( WHERE cond ) ]
Argumentos
-
vetores: uma coluna de
ARRAY<FLOAT>expressões que representam vetores. Todos os vetores devem ter a mesma dimensão. - cond: uma expressão booliana opcional filtrando as linhas usadas para agregação.
Devoluções
Um ARRAY<FLOAT> valor com a mesma dimensão que os vetores de entrada. Cada elemento no resultado é a média dos elementos correspondentes em todos os vetores de entrada.
NULL valores e nãoNULL vetores que contêm um NULL elemento são ignorados na agregação. Retorna NULL se todos os valores no grupo forem inválidos. Retorna uma matriz [] vazia se todos os vetores de entrada estiverem vazios.
Observações
- Há suporte apenas
ARRAY<FLOAT>para outros tipos, comoARRAY<DOUBLE>ouARRAY<DECIMAL>gerar um erro. - Todos os vetores de entrada devem ter a mesma dimensão; caso contrário, a função gera VECTOR_DIMENSION_MISMATCH.
- Um não vetor
NULLque contém umNULLelemento é tratado comoNULL.
Condições de erro
Exemplos
-- Element-wise average per category (with GROUP BY)
> SELECT category, vector_avg(embedding) AS centroid
FROM vector_data
GROUP BY category
ORDER BY category;
category: A, centroid: [3.0, 6.0, 9.0]
category: B, centroid: [2.0, 4.0, 6.0]
-- Scalar aggregation (no GROUP BY)
> SELECT vector_avg(embedding) AS overall_centroid FROM vector_data;
overall_centroid: [2.5, 5.0, 7.5]