Delen via


Invoegtoepassing voor basket

De basket invoegtoepassing vindt frequente patronen van kenmerken in de gegevens en retourneert de patronen die een frequentiedrempelwaarde in die gegevens overschrijden. Een patroon vertegenwoordigt een subset van de rijen met dezelfde waarde in een of meer kolommen. De basket invoegtoepassing is gebaseerd op het Apriori-algoritme dat oorspronkelijk is ontwikkeld voor gegevensanalyse van manden.

Syntax

T | evaluatebasket([ Drempelwaarde,WeightColumn,MaxDimensions,CustomWildcard,CustomWildcard, ... ])

Meer informatie over syntaxisconventies.

Parameters

Naam Type Vereist Beschrijving
Drempel long Een double in het bereik van 0,015 tot 1 waarmee de minimale verhouding van de rijen als frequent wordt beschouwd. Patronen met een kleinere verhouding worden niet geretourneerd. De standaardwaarde is 0,05. Als u de standaardwaarde wilt gebruiken, voert u de tilde in: ~.

Voorbeeld: T | evaluate basket(0.02)
WeightColumn string De kolomnaam die moet worden gebruikt om rekening te houden met elke rij in de invoer op basis van het opgegeven gewicht. Moet een naam zijn van een numerieke kolom, zoals int, long, real. Standaard heeft elke rij een gewicht van 1. Als u de standaardwaarde wilt gebruiken, voert u de tilde in: ~. Een kolom gewicht wordt vaak gebruikt om rekening te houden met steekproeven of bucketing/aggregatie van de gegevens die al in elke rij zijn ingesloten.

Voorbeeld: T | evaluate basket('~', sample_Count)
MaxDimensions int Hiermee stelt u het maximale aantal niet-gerelateerde dimensies per mand in, standaard beperkt, om de queryruntime te minimaliseren. De standaardwaarde is 5. Als u de standaardwaarde wilt gebruiken, voert u de tilde in: ~.

Voorbeeld: T | evaluate basket('~', '~', 3)
CustomWildcard string Hiermee stelt u de jokertekenwaarde in voor een specifiek type in de resultatentabel die aangeeft dat het huidige patroon geen beperking heeft voor deze kolom. De standaardwaarde is null , met uitzondering van tekenreekskolommen waarvan de standaardwaarde een lege tekenreeks is. Als de standaardwaarde een goede waarde in de gegevens is, moet een andere jokertekenwaarde worden gebruikt, zoals *. Als u de standaardwaarde wilt gebruiken, voert u de tilde in: ~.

Voorbeeld: T | evaluate basket('~', '~', '~', '*', int(-1), double(-1), long(0), datetime(1900-1-1))

Notitie

Als u een optionele parameter wilt opgeven die volgt op een optionele parameter, moet u een waarde opgeven voor de voorgaande optionele parameter. Zie Werken met optionele parameters voor meer informatie.

Retouren

De basket invoegtoepassing retourneert frequente patronen die een drempelwaarde voor de verhouding overschrijden. De standaarddrempelwaarde is 0,05.

Elk patroon wordt vertegenwoordigd door een rij in de resultaten. De eerste kolom is de segment-id. De volgende twee kolommen zijn het aantal en het percentage rijen uit de oorspronkelijke query die overeenkomen met het patroon. De resterende kolommen hebben betrekking op de oorspronkelijke query, met een specifieke waarde uit de kolom of een jokertekenwaarde, die standaard null is, wat een variabele waarde betekent.

Notitie

Het algoritme maakt gebruik van steekproeven om de initiƫle frequente waarden te bepalen. Daarom kunnen de resultaten enigszins verschillen tussen meerdere uitvoeringen voor patronen waarvan de frequentie dicht bij de drempelwaarde ligt.

Voorbeeld

StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2)

Uitvoer

SegmentId Count Percentage Staat EventType Schade DamageCrops
0 4574 77.7 NO 0
1 2278 38.7 Hagel NO 0
2 5675 96.4 0
3 2371 40.3 Hagel 0
4 1279 21.7 Onweerswind 0
5 2468 41.9 Hagel
6 1310 22,3 JA
7 1291 21.9 Onweerswind

Voorbeeld met aangepaste jokertekens

StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2, '~', '~', '*', int(-1))

Uitvoer

SegmentId Count Percentage Staat EventType Schade DamageCrops
0 4574 77.7 * * NO 0
1 2278 38.7 * Hagel NO 0
2 5675 96.4 * * * 0
3 2371 40.3 * Hagel * 0
4 1279 21.7 * Onweerswind * 0
5 2468 41.9 * Hagel * -1
6 1310 22,3 * * JA -1
7 1291 21.9 * Onweerswind * -1