Dela via


basket-plugin-program

Plugin-programmet basket hittar frekventa attributmönster i data och returnerar de mönster som passerar ett frekvenströskelvärde i dessa data. Ett mönster representerar en delmängd av raderna som har samma värde i en eller flera kolumner. Plugin-programmet basket baseras på Apriori-algoritmen som ursprungligen utvecklades för datautvinning av korganalys.

Syntax

T | evaluatebasket([ Tröskelvärde,WeightColumn,MaxDimensions,CustomWildcard,CustomWildcard, ... ])

Läs mer om syntaxkonventioner.

Parametrar

Namn Typ Obligatorisk Beskrivning
Tröskelvärde long A double i intervallet 0,015 till 1 som anger det minimala förhållandet mellan raderna som ska betraktas som frekventa. Mönster med ett mindre förhållande returneras inte. Standardvärdet är 0,05. Om du vill använda standardvärdet anger du tilde: ~.

Exempel: T | evaluate basket(0.02)
WeightColumn string Kolumnnamnet som ska användas för att överväga varje rad i indata enligt den angivna vikten. Måste vara ett namn på en kolumn av numerisk typ, till exempel int, long, real. Som standard har varje rad en vikt på 1. Om du vill använda standardvärdet anger du tilde: ~. En vanlig användning av en viktkolumn är att ta hänsyn till sampling eller bucketing/aggregering av data som redan är inbäddade i varje rad.

Exempel: T | evaluate basket('~', sample_Count)
MaxDimensions int Anger det maximala antalet okorrelerade dimensioner per korg, begränsat som standard, för att minimera frågekörningen. Standardvärdet är 5. Om du vill använda standardvärdet anger du tilde: ~.

Exempel: T | evaluate basket('~', '~', 3)
CustomWildcard string Anger jokerteckenvärdet för en viss typ i resultattabellen som anger att det aktuella mönstret inte har någon begränsning för den här kolumnen. Standardvärdet är null förutom strängkolumner vars standardvärde är en tom sträng. Om standardvärdet är ett bra värde i data ska ett annat jokerteckenvärde användas, till exempel *. Om du vill använda standardvärdet anger du tilde: ~.

Exempel: T | evaluate basket('~', '~', '~', '*', int(-1), double(-1), long(0), datetime(1900-1-1))

Anteckning

Om du vill ange en valfri parameter som följer en valfri parameter måste du ange ett värde för den föregående valfria parametern. Mer information finns i Arbeta med valfria parametrar.

Returer

Plugin-programmet basket returnerar frekventa mönster som passerar ett tröskelvärde för förhållandet. Standardtröskelvärdet är 0,05.

Varje mönster representeras av en rad i resultatet. Den första kolumnen är segment-ID. Följande två kolumner är antalet och procentandelen rader, från den ursprungliga frågan som matchar mönstret. De återstående kolumnerna är relaterade till den ursprungliga frågan, med antingen ett specifikt värde från kolumnen eller ett jokerteckenvärde, vilket är som standard null, vilket innebär ett variabelvärde.

Anteckning

Algoritmen använder sampling för att fastställa de inledande frekventa värdena. Därför kan resultaten skilja sig något mellan flera körningar för mönster vars frekvens ligger nära tröskelvärdet.

Exempel

StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2)

Resultat

SegmentId Antal Procent Tillstånd Eventtype Skada DamageCrops
0 4574 77.7 NO 0
1 2278 38.7 Hagel NO 0
2 5675 96.4 0
3 2371 40.3 Hagel 0
4 1279 21.7 Åska vind 0
5 2468 41.9 Hagel
6 1310 22,3 JA
7 1291 21.9 Åska vind

Exempel med anpassade jokertecken

StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2, '~', '~', '*', int(-1))

Resultat

SegmentId Antal Procent Tillstånd Eventtype Skada DamageCrops
0 4574 77.7 * * NO 0
1 2278 38.7 * Hagel NO 0
2 5675 96.4 * * * 0
3 2371 40.3 * Hagel * 0
4 1279 21.7 * Åska vind * 0
5 2468 41.9 * Hagel * -1
6 1310 22,3 * * JA -1
7 1291 21.9 * Åska vind * -1