Aracılığıyla paylaş


dcount() (toplama işlevi)

Özet grubundaki bir skaler ifade tarafından alınan ayrı değerlerin sayısını tahmin eder.

Null değerler yoksayılır ve hesaplamayı dikkate almaz.

Not

dcount() Toplama işlevi, büyük kümelerin kardinalitesini tahmin etmek için öncelikli olarak yararlıdır. Performansın doğruluğunu dengeler ve yürütmeler arasında değişen bir sonuç döndürebilir. Girişlerin sırasının çıkışı üzerinde etkisi olabilir.

Not

Bu işlev summarize işleciyle birlikte kullanılır.

Sözdizimi

dcount(expr[, doğruluk])

Söz dizimi kuralları hakkında daha fazla bilgi edinin.

Parametreler

Ad Tür Zorunlu Açıklama
ifade string ✔️ Ayrı değerleri sayılacak olan giriş.
doğruluk int İstenen tahmin doğruluğunu tanımlayan değer. Varsayılan değer şudur: 1. Desteklenen değerler için bkz . Tahmin doğruluğu .

Döndürülenler

Gruptaki ifadenin farklı değerlerinin sayısını tahmin eder.

Örnek

Bu örnek, her durumda kaç tür fırtına olayının gerçekleştiğini gösterir.

StormEvents
| summarize DifferentEvents=dcount(EventType) by State
| order by DifferentEvents

Gösterilen sonuçlar tablosu yalnızca ilk 10 satırı içerir.

Durum DifferentEvents
TEXAS 27
CALIFORNIA 26
PENNSYLVANIA 25
GEORGIA 24
ILLINOIS 23
MARYLAND 23
NORTH CAROLINA 23
MICHIGAN 22
FLORIDA 22
OREGON 21
KANSAS 21
... ...

Tahmin doğruluğu

Bu işlev, ayarlanmış kardinalitenin stokastik tahminini yapan HyperLogLog (HLL) algoritmasının bir değişkenini kullanır. Algoritma, bellek boyutu başına doğruluk ve yürütme süresini dengelemek için kullanılabilecek bir "düğme" sağlar:

Doğruluk Hata (%) Giriş sayısı
0 1.6 212
1 0.8 214
2 0.4 216
3 0.28 217
4 0,2 218

Not

"Giriş sayısı" sütunu, HLL uygulamasındaki 1 baytlık sayaçların sayısıdır.

Ayarlanan kardinalite yeterince küçükse, algoritmada mükemmel bir sayı (sıfır hata) yapmaya yönelik bazı hükümler bulunur:

  • Doğruluk düzeyi olduğunda 11000 değer döndürülür
  • Doğruluk düzeyi olduğunda 28000 değer döndürülür

Hata sınırı olasılıksaldır, teorik bir sınır değildir. Değer, hata dağılımının standart sapmasıdır (sigma) ve tahminlerin %99,7'sinde göreli hata 3 x sigma'nın altında olur.

Aşağıdaki görüntüde, desteklenen tüm doğruluk ayarları için göreli tahmin hatasının olasılık dağılımı işlevi yüzde olarak gösterilmektedir:

Hll hata dağılımını gösteren grafik.