Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Platí pro:
Databricks Runtime 18.1 a novější
Vypočítá průměr vektorů moudrých prvků v agregaci. Vrátí vektor, kde každý prvek je aritmetický průměr odpovídajících prvků ve všech vstupních vektorech.
Syntaxe
vector_avg(vectors) [FILTER ( WHERE cond ) ]
Argumenty
-
vektory: Sloupec
ARRAY<FLOAT>výrazů představujících vektory. Všechny vektory musí mít stejnou dimenzi. - cond: Volitelný logický výraz filtrující řádky použité pro agregaci.
Návraty
Hodnota ARRAY<FLOAT> se stejnou dimenzí jako vstupní vektory. Každý prvek ve výsledku je průměr odpovídajících prvků napříč všemi vstupními vektory.
NULL hodnoty a neNULL vektory obsahující NULL prvek jsou v agregaci ignorovány. Vrátí NULL , pokud jsou všechny hodnoty ve skupině neplatné. Vrátí prázdnou matici [] , pokud jsou všechny vstupní vektory prázdné.
Poznámky
- Podporuje se pouze
ARRAY<FLOAT>jiné typy, napříkladARRAY<DOUBLE>neboARRAY<DECIMAL>vyvolání chyby. - Všechny vstupní vektory musí mít stejnou dimenzi; jinak funkce vyvolá VECTOR_DIMENSION_MISMATCH.
- Vektor,
NULLkterý obsahujeNULLprvek, je považován zaNULL.
Stavy chyb
Příklady
-- Element-wise average per category (with GROUP BY)
> SELECT category, vector_avg(embedding) AS centroid
FROM vector_data
GROUP BY category
ORDER BY category;
category: A, centroid: [3.0, 6.0, 9.0]
category: B, centroid: [2.0, 4.0, 6.0]
-- Scalar aggregation (no GROUP BY)
> SELECT vector_avg(embedding) AS overall_centroid FROM vector_data;
overall_centroid: [2.5, 5.0, 7.5]