Megosztás a következőn keresztül:


percentile_approx összesítő függvény

A következőkre vonatkozik:jelölje be az igennel jelölt jelölőnégyzetet Databricks SQL jelölje be az igennel jelölt jelölőnégyzetet Databricks Runtime

A csoporton belüli elem hozzávetőleges percentilisét adja vissza expr. Ez a függvény az approx_percentile összesítő függvény szinonimája.

Szintaxis

percentile_approx ( [ALL | DISTINCT ] expr, percentile [, accuracy] ) [FILTER ( WHERE cond ) ]

Ez a függvény ablakfüggvényként is meghívható a OVER záradék használatával.

Argumentumok

  • expr: Numerikus kifejezés.
  • percentile: Számkonstans 0 és 1 között, vagy számértékek literális tömbje 0 és 1 között.
  • accuracy: 0-nál nagyobb egész szám literál. Ha a pontosság nincs megadva, akkor a beállítás értéke 10000.
  • cond: Nem kötelező logikai kifejezés, amely az összesítéshez használt sorokat szűri.

Visszatérítések

Az aggregátumfüggvény azt a kifejezést adja vissza, amely a rendezett csoport legkisebb értéke (a legkisebbtől a legnagyobbig rendezve), így az értékek közül percentileexpr legfeljebb az érték kisebb, vagy egyenlő az adott értékkel. Ha a percentile percentile_approx tömb, akkor expr esetén visszaadja a megadott percentilishez tartozó hozzávetőleges percentilistömböt.

A accuracy paraméter a memóriaköltség közelítési pontosságát szabályozza. A nagyobb pontosság jobb pontosságot eredményez, 1.0/accuracy a közelítés relatív hibája.

Ha DISTINCT meg van adva, a függvény csak egyedi értékkészleten expr működik.

Példák

> SELECT percentile_approx(col, array(0.5, 0.4, 0.1), 100)
    FROM VALUES (0), (1), (2), (10) AS tab(col);
 [1,1,0]

> SELECT percentile_approx(col, 0.5, 100)
    FROM VALUES (0), (6), (7), (9), (10), (10), (10) AS tab(col);
 9

> SELECT percentile_approx(DISTINCT col, 0.5, 100)
    FROM VALUES (0), (6), (7), (9), (10), (10), (10) AS tab(col);
 7