dcount() (toplama işlevi)
Özet grubundaki bir skaler ifade tarafından alınan ayrı değerlerin sayısını tahmin eder.
Null değerler yoksayılır ve hesaplamayı dikkate almaz.
Not
dcount()
Toplama işlevi, büyük kümelerin kardinalitesini tahmin etmek için öncelikli olarak yararlıdır. Performansın doğruluğunu dengeler ve yürütmeler arasında değişen bir sonuç döndürebilir. Girişlerin sırasının çıkışı üzerinde etkisi olabilir.
Not
Bu işlev summarize işleciyle birlikte kullanılır.
Syntax
dcount
(
expr[,
doğruluk])
Söz dizimi kuralları hakkında daha fazla bilgi edinin.
Parametreler
Ad | Tür | Gerekli | Açıklama |
---|---|---|---|
ifade | string |
✔️ | Ayrı değerleri sayılacak olan giriş. |
Doğru -luk | int |
İstenen tahmin doğruluğunu tanımlayan değer. 1 varsayılan değerdir. Desteklenen değerler için bkz. Tahmin doğruluğu . |
Döndürülenler
Gruptaki ifadenin ayrı değerlerinin sayısına ilişkin bir tahmin döndürür.
Örnek
Bu örnekte her durumda kaç tür fırtına olayının gerçekleştiği gösterilmektedir.
StormEvents
| summarize DifferentEvents=dcount(EventType) by State
| order by DifferentEvents
Gösterilen sonuçlar tablosu yalnızca ilk 10 satırı içerir.
Durum | DifferentEvents |
---|---|
TEXAS | 27 |
CALİFORNİA | 26 |
PENNSYLVANIA | 25 |
GÜRCİSTAN | 24 |
ILLİNOİS | 23 |
MARYLAND | 23 |
KUZEY CAROLINA | 23 |
MICHIGAN | 22 |
FLORİDA | 22 |
OREGON | 21 |
KANSAS | 21 |
... | ... |
Tahmin doğruluğu
Bu işlev, küme kardinalitesinin stokastik tahminini yapan HyperLogLog (HLL) algoritmasının bir değişkenini kullanır. Algoritma, bellek boyutu başına doğruluk ve yürütme süresini dengelemek için kullanılabilecek bir "düğme" sağlar:
Doğruluk | Hata (%) | Giriş sayısı |
---|---|---|
0 | 1.6 | 212 |
1 | 0,8 | 214 |
2 | 0,4 | 216 |
3 | 0.28 | 217 |
4 | 0,2 | 218 |
Not
"Giriş sayısı" sütunu, HLL uygulamasındaki 1 baytlık sayaçların sayısıdır.
Küme kardinalitesi yeterince küçükse algoritma, mükemmel bir sayı (sıfır hata) yapmaya yönelik bazı hükümler içerir:
- Doğruluk düzeyi olduğunda
1
1000 değer döndürülür - Doğruluk düzeyi olduğunda
2
8000 değer döndürülür
Hata sınırı olasılıktır, teorik bir sınır değildir. Değer, hata dağılımının standart sapmasıdır (sigma) ve tahminlerin %99,7'sinde 3 x sigma'nın altında göreli bir hata olur.
Aşağıdaki görüntüde, desteklenen tüm doğruluk ayarları için yüzde cinsinden göreli tahmin hatasının olasılık dağılımı işlevi gösterilmektedir:
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin