hll_merge()

Cikk
01/23/2024

Egyesíti a HLL-eredményeket. Ez az összesített verzió skaláris verziója hll_merge().

A mögöttes algoritmusról (HyperLogLog) és a becslés pontosságáról olvashat.

Fontos

A hll(), hll_if() és hll_merge() eredményei tárolhatók és később lekérhetők. Előfordulhat például, hogy létre szeretne hozni egy napi egyedi felhasználói összefoglalót, amely aztán a heti számok kiszámítására használható. Az eredmények pontos bináris ábrázolása azonban idővel változhat. Nincs garancia arra, hogy ezek a függvények azonos eredményeket adnak az azonos bemenetekhez, ezért nem javasoljuk, hogy támaszkodjanak rájuk.

Syntax

hll_merge(hll,hll2, [ hll3, ... ])

További információ a szintaxis konvenciókról.

Paraméterek

Név	Típus	Kötelező	Leírás
hll, hll2, ...	`string`	✔️	Az egyesítendő HLL-értékeket tartalmazó oszlopnevek. A függvény 2–64 argumentumot vár.

Válaszok

Egy HLL-értéket ad vissza. Az érték a hll, hll2, ... oszlop egyesítésének eredménye. hllN.

Példák

Ez a példa az egyesített oszlopok értékét mutatja be.

A lekérdezés futtatása

range x from 1 to 10 step 1 
| extend y = x + 10
| summarize hll_x = hll(x), hll_y = hll(y)
| project merged = hll_merge(hll_x, hll_y)
| project dcount_hll(merged)

Kimenet

`dcount_hll_merged`
20

Becslés pontossága

Ez a függvény a HyperLogLog (HLL) algoritmus egy variánsát használja, amely a beállított számosság sztochasztikus becslését végzi el. Az algoritmus egy "gombot" biztosít, amellyel kiegyensúlyozni lehet a memóriaméretenkénti pontosságot és végrehajtási időt:

Pontosság	Hiba (%)	Bejegyzésszám
0	1.6	2¹²
1	0,8	2¹⁴
2	0,4	2¹⁶
3	0,28	2¹⁷
4	0,2	2¹⁸

Megjegyzés

A "bejegyzésszám" oszlop az 1 bájtos számlálók száma a HLL-implementációban.

Az algoritmus tartalmaz néhány rendelkezést a tökéletes szám (nulla hiba) elvégzésére, ha a beállított számosság elég kicsi:

Ha a pontossági szint , 1a rendszer 1000 értéket ad vissza
Ha a pontossági szint , 2a rendszer 8000 értéket ad vissza

A hibakötés valószínűségi, nem elméleti kötött. Az érték a hibaeloszlás szórása (a szigma), és a becslések 99,7%-a 3 x szigma alatti relatív hibával fog rendelkezni.

Az alábbi képen a relatív becslési hiba valószínűségeloszlási függvénye látható százalékban az összes támogatott pontossági beállítás esetében:

A hll hibaeloszlást ábrázoló grafikon.

Megosztás a következőn keresztül: