hll_merge()
Egyesíti a HLL-eredményeket. Ez az összesített verzió skaláris verziója hll_merge()
.
A mögöttes algoritmusról (HyperLogLog) és a becslés pontosságáról olvashat.
Fontos
A hll(), hll_if() és hll_merge() eredményei tárolhatók és később lekérhetők. Előfordulhat például, hogy létre szeretne hozni egy napi egyedi felhasználói összefoglalót, amely aztán a heti számok kiszámítására használható. Az eredmények pontos bináris ábrázolása azonban idővel változhat. Nincs garancia arra, hogy ezek a függvények azonos eredményeket adnak az azonos bemenetekhez, ezért nem javasoljuk, hogy támaszkodjanak rájuk.
Syntax
hll_merge(
hll,
hll2,
[ hll3,
... ])
További információ a szintaxis konvenciókról.
Paraméterek
Név | Típus | Kötelező | Leírás |
---|---|---|---|
hll, hll2, ... | string |
✔️ | Az egyesítendő HLL-értékeket tartalmazó oszlopnevek. A függvény 2–64 argumentumot vár. |
Válaszok
Egy HLL-értéket ad vissza. Az érték a hll, hll2, ... oszlop egyesítésének eredménye. hllN.
Példák
Ez a példa az egyesített oszlopok értékét mutatja be.
range x from 1 to 10 step 1
| extend y = x + 10
| summarize hll_x = hll(x), hll_y = hll(y)
| project merged = hll_merge(hll_x, hll_y)
| project dcount_hll(merged)
Kimenet
dcount_hll_merged |
---|
20 |
Becslés pontossága
Ez a függvény a HyperLogLog (HLL) algoritmus egy variánsát használja, amely a beállított számosság sztochasztikus becslését végzi el. Az algoritmus egy "gombot" biztosít, amellyel kiegyensúlyozni lehet a memóriaméretenkénti pontosságot és végrehajtási időt:
Pontosság | Hiba (%) | Bejegyzésszám |
---|---|---|
0 | 1.6 | 212 |
1 | 0,8 | 214 |
2 | 0,4 | 216 |
3 | 0,28 | 217 |
4 | 0,2 | 218 |
Megjegyzés
A "bejegyzésszám" oszlop az 1 bájtos számlálók száma a HLL-implementációban.
Az algoritmus tartalmaz néhány rendelkezést a tökéletes szám (nulla hiba) elvégzésére, ha a beállított számosság elég kicsi:
- Ha a pontossági szint ,
1
a rendszer 1000 értéket ad vissza - Ha a pontossági szint ,
2
a rendszer 8000 értéket ad vissza
A hibakötés valószínűségi, nem elméleti kötött. Az érték a hibaeloszlás szórása (a szigma), és a becslések 99,7%-a 3 x szigma alatti relatív hibával fog rendelkezni.
Az alábbi képen a relatív becslési hiba valószínűségeloszlási függvénye látható százalékban az összes támogatott pontossági beállítás esetében:
Visszajelzés
https://aka.ms/ContentUserFeedback.
Hamarosan elérhető: 2024-ben fokozatosan kivezetjük a GitHub-problémákat a tartalom visszajelzési mechanizmusaként, és lecseréljük egy új visszajelzési rendszerre. További információ:Visszajelzés küldése és megtekintése a következőhöz: