autocluster eklentisi
autocluster
verilerdeki ayrık özniteliklerin (boyutlar) ortak desenlerini bulur. Ardından ister 100 ister 100.000 satır olsun, özgün sorgunun sonuçlarını birkaç desene küçültür. Eklenti, hataları (özel durumlar veya kilitlenmeler gibi) analiz etmeye yardımcı olmak için geliştirilmiştir ancak filtrelenmiş veri kümelerinde çalışma olasılığı vardır. Eklenti işleciyle birlikte çağrılır evaluate
.
Not
autocluster
büyük ölçüde aşağıdaki makaledeki Seed-Expand algoritmasını temel alır: Ayrık Öznitelikler Kullanılarak Telemetri Veri Madenciliği Algoritmaları.
Sözdizimi
T evaluate
(
|
autocluster
[SizeWeight [,
WeightColumn [,
NumSeeds [,
CustomWildcard [,
... ]]]]])
Söz dizimi kuralları hakkında daha fazla bilgi edinin.
Parametreler
Parametreler söz diziminde belirtildiği gibi sıralanmalıdır. Varsayılan değerin kullanılması gerektiğini belirtmek için dize tilde değerini ~
koyun. Daha fazla bilgi için bkz . Örnekler.
Adı | Tür | Zorunlu | Açıklama |
---|---|---|---|
T | string |
✔️ | Giriş tablosal ifadesi. |
SizeWeight | çift | Genel (yüksek kapsam) ile bilgilendirici (birçok paylaşılan) değer arasındaki dengeyi denetleen 0 ile 1 arasında bir çift. Bu değerin artırılması genellikle kapsamı genişletirken desen miktarını azaltır. Buna karşılık, bu değerin azaltılması, artan paylaşılan değerler ve daha küçük bir yüzde kapsamı ile karakterize edilen daha belirli desenler oluşturur. Varsayılan değer: 0.5 . Formül, ağırlıkları ve 1-SizeWeight olan ağırlıklı geometrik bir ortalamadırSizeWeight . |
|
WeightColumn | string |
Girişteki her satırı belirtilen ağırlığa göre dikkate alır. Her satırın varsayılan ağırlığı vardır 1 . Bağımsız değişken, sayısal bir tamsayı sütununun adı olmalıdır. Ağırlık sütununun yaygın kullanımlarından biri, her satıra zaten eklenmiş olan verilerin örneklemesini, demetlerini veya toplamasını dikkate almaktır. |
|
NumSeeds | int |
İlk yerel arama noktalarının sayısını belirler. Tohum sayısının ayarlanması, veri yapısına göre sonuç miktarını veya kalitesini etkiler. Tohumların artırılması sonuçları geliştirebilir ancak daha yavaş sorgu dengelenebilir. Beşin altında düşüş göz ardı edilebilir iyileştirmeler sağlarken, 50'nin üzerine çıkarılma seyrek daha fazla desen oluşturur. Varsayılan değer: 25 . |
|
CustomWildcard | string |
Sonuçlar tablosundaki belirli bir tür için joker karakter değerini ayarlayan ve bu sütunda kısıtlama olmadığını belirten bir tür değişmez değeri. Varsayılan değer, boş bir dizeyi temsil eden değeridir null . Varsayılan değer verilerde iyi bir değerse, gibi * farklı bir joker karakter değeri kullanılmalıdır. Birden çok özel joker karakteri art arda ekleyerek ekleyebilirsiniz. |
Döndürülenler
Eklenti autocluster
genellikle küçük bir desen kümesi döndürür. Desenler, birden çok ayrı öznitelik arasında paylaşılan ortak değerlerle verilerin bölümlerini yakalar. Sonuçlardaki her desen bir satırla temsil edilir.
İlk sütun segment kimliğidir. Sonraki iki sütun, desen tarafından yakalanan özgün sorgudaki satırların sayısı ve yüzdesidir. Kalan sütunlar özgün sorgudan alınıyor. Değerleri sütundaki belirli bir değer veya değişken değerleri anlamına gelen joker değerdir (varsayılan olarak null değerdir).
Desenler ayrı değildir, çakışıyor olabilir ve genellikle tüm özgün satırları kapsamaz. Bazı satırlar herhangi bir desenin altına düşmeyebilir.
İpucu
Verileri yalnızca ilgilendiğiniz noktaya küçültmek için giriş kanalında where ve project kullanın.
İlginç bir satır bulduğunuzda, filtrenize belirli değerlerini ekleyerek daha fazla detaya gitmek isteyebilirsiniz where
.
Örnekler
Değerlendirmeyi kullanma
T | evaluate autocluster()
Otomatik kümeyi kullanma
StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State , EventType , Damage
| evaluate autocluster(0.6)
Çıktı
SegmentKimliği | Sayı | Yüzde | Durum | EventType | Hasar |
---|---|---|---|---|---|
0 | 2278 | 38.7 | Dolu | HAYIR | |
1 | 512 | 8.7 | Gök Gürültülü Fırtına | EVET | |
2 | 898 | 15.3 | TEXAS |
Özel joker karakterler kullanma
StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State , EventType , Damage
| evaluate autocluster(0.2, '~', '~', '*')
Çıktı
SegmentKimliği | Sayı | Yüzde | Durum | EventType | Hasar |
---|---|---|---|---|---|
0 | 2278 | 38.7 | * | Dolu | HAYIR |
1 | 512 | 8.7 | * | Gök Gürültülü Fırtına | EVET |
2 | 898 | 15.3 | TEXAS | * | * |
İlgili içerik
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin