Aracılığıyla paylaş


autocluster eklentisi

autocluster verilerdeki ayrık özniteliklerin (boyutlar) ortak desenlerini bulur. Ardından ister 100 ister 100.000 satır olsun, özgün sorgunun sonuçlarını birkaç desene küçültür. Eklenti, hataları (özel durumlar veya kilitlenmeler gibi) analiz etmeye yardımcı olmak için geliştirilmiştir ancak filtrelenmiş veri kümelerinde çalışma olasılığı vardır. Eklenti işleciyle birlikte çağrılır evaluate .

Not

autocluster büyük ölçüde aşağıdaki makaledeki Seed-Expand algoritmasını temel alır: Ayrık Öznitelikler Kullanılarak Telemetri Veri Madenciliği Algoritmaları.

Sözdizimi

T evaluate (| autocluster [SizeWeight [, WeightColumn [, NumSeeds [, CustomWildcard [, ... ]]]]])

Söz dizimi kuralları hakkında daha fazla bilgi edinin.

Parametreler

Parametreler söz diziminde belirtildiği gibi sıralanmalıdır. Varsayılan değerin kullanılması gerektiğini belirtmek için dize tilde değerini ~koyun. Daha fazla bilgi için bkz . Örnekler.

Adı Tür Zorunlu Açıklama
T string ✔️ Giriş tablosal ifadesi.
SizeWeight çift Genel (yüksek kapsam) ile bilgilendirici (birçok paylaşılan) değer arasındaki dengeyi denetleen 0 ile 1 arasında bir çift. Bu değerin artırılması genellikle kapsamı genişletirken desen miktarını azaltır. Buna karşılık, bu değerin azaltılması, artan paylaşılan değerler ve daha küçük bir yüzde kapsamı ile karakterize edilen daha belirli desenler oluşturur. Varsayılan değer: 0.5. Formül, ağırlıkları ve 1-SizeWeightolan ağırlıklı geometrik bir ortalamadırSizeWeight.
WeightColumn string Girişteki her satırı belirtilen ağırlığa göre dikkate alır. Her satırın varsayılan ağırlığı vardır 1. Bağımsız değişken, sayısal bir tamsayı sütununun adı olmalıdır. Ağırlık sütununun yaygın kullanımlarından biri, her satıra zaten eklenmiş olan verilerin örneklemesini, demetlerini veya toplamasını dikkate almaktır.
NumSeeds int İlk yerel arama noktalarının sayısını belirler. Tohum sayısının ayarlanması, veri yapısına göre sonuç miktarını veya kalitesini etkiler. Tohumların artırılması sonuçları geliştirebilir ancak daha yavaş sorgu dengelenebilir. Beşin altında düşüş göz ardı edilebilir iyileştirmeler sağlarken, 50'nin üzerine çıkarılma seyrek daha fazla desen oluşturur. Varsayılan değer: 25.
CustomWildcard string Sonuçlar tablosundaki belirli bir tür için joker karakter değerini ayarlayan ve bu sütunda kısıtlama olmadığını belirten bir tür değişmez değeri. Varsayılan değer, boş bir dizeyi temsil eden değeridir null. Varsayılan değer verilerde iyi bir değerse, gibi *farklı bir joker karakter değeri kullanılmalıdır. Birden çok özel joker karakteri art arda ekleyerek ekleyebilirsiniz.

Döndürülenler

Eklenti autocluster genellikle küçük bir desen kümesi döndürür. Desenler, birden çok ayrı öznitelik arasında paylaşılan ortak değerlerle verilerin bölümlerini yakalar. Sonuçlardaki her desen bir satırla temsil edilir.

İlk sütun segment kimliğidir. Sonraki iki sütun, desen tarafından yakalanan özgün sorgudaki satırların sayısı ve yüzdesidir. Kalan sütunlar özgün sorgudan alınıyor. Değerleri sütundaki belirli bir değer veya değişken değerleri anlamına gelen joker değerdir (varsayılan olarak null değerdir).

Desenler ayrı değildir, çakışıyor olabilir ve genellikle tüm özgün satırları kapsamaz. Bazı satırlar herhangi bir desenin altına düşmeyebilir.

İpucu

Verileri yalnızca ilgilendiğiniz noktaya küçültmek için giriş kanalında where ve project kullanın.

İlginç bir satır bulduğunuzda, filtrenize belirli değerlerini ekleyerek daha fazla detaya gitmek isteyebilirsiniz where .

Örnekler

Değerlendirmeyi kullanma

T | evaluate autocluster()

Otomatik kümeyi kullanma

StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State , EventType , Damage
| evaluate autocluster(0.6)

Çıktı

SegmentKimliği Sayı Yüzde Durum EventType Hasar
0 2278 38.7 Dolu HAYIR
1 512 8.7 Gök Gürültülü Fırtına EVET
2 898 15.3 TEXAS

Özel joker karakterler kullanma

StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State , EventType , Damage
| evaluate autocluster(0.2, '~', '~', '*')

Çıktı

SegmentKimliği Sayı Yüzde Durum EventType Hasar
0 2278 38.7 * Dolu HAYIR
1 512 8.7 * Gök Gürültülü Fırtına EVET
2 898 15.3 TEXAS * *