`vector_avg` agregační funkce

Platí pro: check označený ano Databricks Runtime 18.1 a novější

Vypočítá průměr vektorů moudrých prvků v agregaci. Vrátí vektor, kde každý prvek je aritmetický průměr odpovídajících prvků ve všech vstupních vektorech.

Syntaxe

vector_avg(vectors) [FILTER ( WHERE cond ) ]

Argumenty

vektory: Sloupec ARRAY<FLOAT> výrazů představujících vektory. Všechny vektory musí mít stejnou dimenzi.
cond: Volitelný logický výraz filtrující řádky použité pro agregaci.

Návraty

Hodnota ARRAY<FLOAT> se stejnou dimenzí jako vstupní vektory. Každý prvek ve výsledku je průměr odpovídajících prvků napříč všemi vstupními vektory.

NULL hodnoty a neNULL vektory obsahující NULL prvek jsou v agregaci ignorovány. Vrátí NULL , pokud jsou všechny hodnoty ve skupině neplatné. Vrátí prázdnou matici [] , pokud jsou všechny vstupní vektory prázdné.

Poznámky

Podporuje se pouze ARRAY<FLOAT> jiné typy, například ARRAY<DOUBLE> nebo ARRAY<DECIMAL> vyvolání chyby.
Všechny vstupní vektory musí mít stejnou dimenzi; jinak funkce vyvolá VECTOR_DIMENSION_MISMATCH.
Vektor,NULL který obsahuje NULL prvek, je považován za NULL.

Stavy chyb

NESHODA_DIMENZE_VEKTORU

Příklady

-- Element-wise average per category (with GROUP BY)
> SELECT category, vector_avg(embedding) AS centroid
    FROM vector_data
    GROUP BY category
    ORDER BY category;
  category: A, centroid: [3.0, 6.0, 9.0]
  category: B, centroid: [2.0, 4.0, 6.0]

-- Scalar aggregation (no GROUP BY)
> SELECT vector_avg(embedding) AS overall_centroid FROM vector_data;
  overall_centroid: [2.5, 5.0, 7.5]

Váš názor

Byla tato stránka užitečná?

Last updated on 2026-03-15

Sdílet prostřednictvím

vector_avg agregační funkce