dcount() (toplama işlevi)

Sürüm açılan listesini kullanarak hizmetler arasında geçiş yapın. Gezinti hakkında daha fazla bilgi edinin.
Şunlar için geçerlidir: ✅ Microsoft Fabric ✅ Azure Veri Gezgini ✅ Azure İzleyici ✅ Microsoft Sentinel

Özet grubundaki bir skaler ifade tarafından alınan ayrı değerlerin sayısını tahmin eder.

Null değerler yoksayılır ve hesaplamayı dikkate almaz.

Not

dcount() Toplama işlevi, büyük kümelerin kardinalitesini tahmin etmek için öncelikli olarak yararlıdır. Performansın doğruluğunu dengeler ve yürütmeler arasında değişen bir sonuç döndürebilir. Girişlerin sırasının çıkışı üzerinde etkisi olabilir.

Not

Bu işlev summarize işleciyle birlikte kullanılır.

Sözdizimi

dcount ( expr[,doğruluk])

Söz dizimi kuralları hakkında daha fazla bilgi edinin.

Parametreler

Ad Tür Zorunlu Açıklama
ifade string ✔️ Ayrı değerleri sayılacak olan giriş.
doğruluk int İstenen tahmin doğruluğunu tanımlayan değer. Varsayılan değer şudur: 1. Desteklenen değerler için bkz . Tahmin doğruluğu .

Döndürülenler

Gruptaki ifadenin farklı değerlerinin sayısını tahmin eder.

Örnekler

Aşağıdaki örnekte her durumda kaç tür fırtına olayı gerçekleştiği gösterilmektedir.

StormEvents
| summarize DifferentEvents=dcount(EventType) by State
| order by DifferentEvents

Gösterilen sonuçlar tablosu yalnızca ilk 10 satırı içerir.

Devlet DifferentEvents
TEXAS 27
CALİFORNİA 26
PENNSYLVANİA Yirmi beş
GÜRCİSTAN yirmi dört
ILLİNOİS 23
MARYLAND 23
KUZEY CAROLINA 23
MİCHİGAN 22
FLORİDA 22
OREGON 21
KANSAS 21
... ...

Tahmin doğruluğu

Bu işlev, ayarlanmış kardinalitenin stokastik tahminini yapan HyperLogLog (HLL) algoritmasının bir değişkenini kullanır. Algoritma, bellek boyutu başına doğruluk ve yürütme süresini dengelemek için kullanılabilecek bir "düğme" sağlar:

Doğruluk Hata (%) Giriş sayısı
0 1.6 212
1 0.8 214
2 0.4 216
3 0.28 217
4 0,2 218

Not

"Giriş sayısı" sütunu, HLL uygulamasındaki 1 baytlık sayaçların sayısıdır.

Ayarlanan kardinalite yeterince küçükse, algoritmada mükemmel bir sayı (sıfır hata) yapmaya yönelik bazı hükümler bulunur:

  • Doğruluk düzeyi olduğunda 11000 değer döndürülür
  • Doğruluk düzeyi olduğunda 28000 değer döndürülür

Hata sınırı olasılıksaldır, teorik bir sınır değildir. Değer, hata dağılımının standart sapmasıdır (sigma) ve tahminlerin %99,7'sinde göreli hata 3 x sigma'nın altında olur.

Aşağıdaki görüntüde, desteklenen tüm doğruluk ayarları için göreli tahmin hatasının olasılık dağılımı işlevi yüzde olarak gösterilmektedir:

Hll hata dağılımını gösteren grafik.