Aracılığıyla paylaş


hll_merge() (toplama işlevi)

Şunlar için geçerlidir: ✅Microsoft Fabric✅Azure Veri Gezgini Azure İzleyiciMicrosoft Sentinel

HLL sonuçlarını grup genelinde tek bir HLL değeriyle birleştirir.

Not

Farklı doğruluk değerleri kullanılarak oluşturulan hll değerlerini birleştiremezsiniz. Daha fazla bilgi için bkz . hll().

Not

Bu işlev summarize işleciyle birlikte kullanılır.

Daha fazla bilgi için temel algoritmaya (HyperLog Log) ve tahmin doğruluğuna bakın.

Önemli

hll(), hll_if() ve hll_merge() sonuçları depolanabilir ve daha sonra alınabilir. Örneğin, daha sonra haftalık sayıları hesaplamak için kullanılabilecek günlük benzersiz kullanıcılar özeti oluşturmak isteyebilirsiniz. Ancak, bu sonuçların kesin ikili gösterimi zaman içinde değişebilir. Bu işlevlerin özdeş girişler için aynı sonuçları üretmesi garanti değildir ve bu nedenle bunlara güvenmeniz önerilir.

Sözdizimi

hll_merge(hll)

Söz dizimi kuralları hakkında daha fazla bilgi edinin.

Parametreler

Ad Tür Zorunlu Açıklama
hll string ✔️ Birleştirilecek HLL değerlerini içeren sütun adı.

Döndürülenler

İşlev, grup genelinde hll'nin birleştirilmiş HLL değerlerini döndürür.

İpucu

hll() ve hll_merge() toplama işlevlerini hesaplamak dcount için dcount_hll işlevini kullanın.

Örnek

Aşağıdaki örnek, tek bir HLL değeriyle birleştirilmiş bir grup genelinde HLL sonuçlarını gösterir.

StormEvents
| summarize hllRes = hll(DamageProperty) by bin(StartTime,10m)
| summarize hllMerged = hll_merge(hllRes)

Çıktı

Sonuçlar dizideki yalnızca ilk beş sonucu gösterir.

hllMerged
[[1024,14],["-6903255281122589438","-7413697181929588220","-2396604341988936699","5824198135224880646","-6257421034880415225", ...],[]]

Tahmin doğruluğu

Bu işlev, ayarlanmış kardinalitenin stokastik tahminini yapan HyperLogLog (HLL) algoritmasının bir değişkenini kullanır. Algoritma, bellek boyutu başına doğruluk ve yürütme süresini dengelemek için kullanılabilecek bir "düğme" sağlar:

Doğruluk Hata (%) Giriş sayısı
0 1.6 212
1 0.8 214
2 0.4 216
3 0.28 217
4 0,2 218

Not

"Giriş sayısı" sütunu, HLL uygulamasındaki 1 baytlık sayaçların sayısıdır.

Ayarlanan kardinalite yeterince küçükse, algoritmada mükemmel bir sayı (sıfır hata) yapmaya yönelik bazı hükümler bulunur:

  • Doğruluk düzeyi olduğunda 11000 değer döndürülür
  • Doğruluk düzeyi olduğunda 28000 değer döndürülür

Hata sınırı olasılıksaldır, teorik bir sınır değildir. Değer, hata dağılımının standart sapmasıdır (sigma) ve tahminlerin %99,7'sinde göreli hata 3 x sigma'nın altında olur.

Aşağıdaki görüntüde, desteklenen tüm doğruluk ayarları için göreli tahmin hatasının olasılık dağılımı işlevi yüzde olarak gösterilmektedir:

Hll hata dağılımını gösteren grafik.