Megosztás a következőn keresztül:


hll_merge()

Egyesíti a HLL-eredményeket. Ez az összesített verzió skaláris verziója hll_merge().

A mögöttes algoritmusról (HyperLogLog) és a becslés pontosságáról olvashat.

Fontos

A hll(), hll_if() és hll_merge() eredményei tárolhatók és később lekérhetők. Előfordulhat például, hogy létre szeretne hozni egy napi egyedi felhasználói összefoglalót, amely aztán a heti számok kiszámítására használható. Az eredmények pontos bináris ábrázolása azonban idővel változhat. Nincs garancia arra, hogy ezek a függvények azonos eredményeket adnak az azonos bemenetekhez, ezért nem javasoljuk, hogy támaszkodjanak rájuk.

Syntax

hll_merge(hll,hll2, [ hll3, ... ])

További információ a szintaxis konvenciókról.

Paraméterek

Név Típus Kötelező Leírás
hll, hll2, ... string ✔️ Az egyesítendő HLL-értékeket tartalmazó oszlopnevek. A függvény 2–64 argumentumot vár.

Válaszok

Egy HLL-értéket ad vissza. Az érték a hll, hll2, ... oszlop egyesítésének eredménye. hllN.

Példák

Ez a példa az egyesített oszlopok értékét mutatja be.

range x from 1 to 10 step 1 
| extend y = x + 10
| summarize hll_x = hll(x), hll_y = hll(y)
| project merged = hll_merge(hll_x, hll_y)
| project dcount_hll(merged)

Kimenet

dcount_hll_merged
20

Becslés pontossága

Ez a függvény a HyperLogLog (HLL) algoritmus egy variánsát használja, amely a beállított számosság sztochasztikus becslését végzi el. Az algoritmus egy "gombot" biztosít, amellyel kiegyensúlyozni lehet a memóriaméretenkénti pontosságot és végrehajtási időt:

Pontosság Hiba (%) Bejegyzésszám
0 1.6 212
1 0,8 214
2 0,4 216
3 0,28 217
4 0,2 218

Megjegyzés

A "bejegyzésszám" oszlop az 1 bájtos számlálók száma a HLL-implementációban.

Az algoritmus tartalmaz néhány rendelkezést a tökéletes szám (nulla hiba) elvégzésére, ha a beállított számosság elég kicsi:

  • Ha a pontossági szint , 1a rendszer 1000 értéket ad vissza
  • Ha a pontossági szint , 2a rendszer 8000 értéket ad vissza

A hibakötés valószínűségi, nem elméleti kötött. Az érték a hibaeloszlás szórása (a szigma), és a becslések 99,7%-a 3 x szigma alatti relatív hibával fog rendelkezni.

Az alábbi képen a relatív becslési hiba valószínűségeloszlási függvénye látható százalékban az összes támogatott pontossági beállítás esetében:

A hll hibaeloszlást ábrázoló grafikon.