Invoegtoepassing voor basket
De basket
invoegtoepassing vindt frequente patronen van kenmerken in de gegevens en retourneert de patronen die een frequentiedrempelwaarde in die gegevens overschrijden. Een patroon vertegenwoordigt een subset van de rijen met dezelfde waarde in een of meer kolommen. De basket
invoegtoepassing is gebaseerd op het Apriori-algoritme dat oorspronkelijk is ontwikkeld voor gegevensanalyse van manden.
Syntax
T | evaluate
basket
(
[ Drempelwaarde,
WeightColumn,
MaxDimensions,
CustomWildcard,
CustomWildcard,
... ])
Meer informatie over syntaxisconventies.
Parameters
Naam | Type | Vereist | Beschrijving |
---|---|---|---|
Drempel | long |
Een double in het bereik van 0,015 tot 1 waarmee de minimale verhouding van de rijen als frequent wordt beschouwd. Patronen met een kleinere verhouding worden niet geretourneerd. De standaardwaarde is 0,05. Als u de standaardwaarde wilt gebruiken, voert u de tilde in: ~ .Voorbeeld: T | evaluate basket(0.02) |
|
WeightColumn | string |
De kolomnaam die moet worden gebruikt om rekening te houden met elke rij in de invoer op basis van het opgegeven gewicht. Moet een naam zijn van een numerieke kolom, zoals int , long , real . Standaard heeft elke rij een gewicht van 1. Als u de standaardwaarde wilt gebruiken, voert u de tilde in: ~ . Een kolom gewicht wordt vaak gebruikt om rekening te houden met steekproeven of bucketing/aggregatie van de gegevens die al in elke rij zijn ingesloten.Voorbeeld: T | evaluate basket('~', sample_Count) |
|
MaxDimensions | int |
Hiermee stelt u het maximale aantal niet-gerelateerde dimensies per mand in, standaard beperkt, om de queryruntime te minimaliseren. De standaardwaarde is 5. Als u de standaardwaarde wilt gebruiken, voert u de tilde in: ~ .Voorbeeld: T | evaluate basket('~', '~', 3) |
|
CustomWildcard | string |
Hiermee stelt u de jokertekenwaarde in voor een specifiek type in de resultatentabel die aangeeft dat het huidige patroon geen beperking heeft voor deze kolom. De standaardwaarde is null , met uitzondering van tekenreekskolommen waarvan de standaardwaarde een lege tekenreeks is. Als de standaardwaarde een goede waarde in de gegevens is, moet een andere jokertekenwaarde worden gebruikt, zoals * . Als u de standaardwaarde wilt gebruiken, voert u de tilde in: ~ .Voorbeeld: T | evaluate basket('~', '~', '~', '*', int(-1), double(-1), long(0), datetime(1900-1-1)) |
Notitie
Als u een optionele parameter wilt opgeven die volgt op een optionele parameter, moet u een waarde opgeven voor de voorgaande optionele parameter. Zie Werken met optionele parameters voor meer informatie.
Retouren
De basket
invoegtoepassing retourneert frequente patronen die een drempelwaarde voor de verhouding overschrijden. De standaarddrempelwaarde is 0,05.
Elk patroon wordt vertegenwoordigd door een rij in de resultaten. De eerste kolom is de segment-id. De volgende twee kolommen zijn het aantal en het percentage rijen uit de oorspronkelijke query die overeenkomen met het patroon. De resterende kolommen hebben betrekking op de oorspronkelijke query, met een specifieke waarde uit de kolom of een jokertekenwaarde, die standaard null is, wat een variabele waarde betekent.
Notitie
Het algoritme maakt gebruik van steekproeven om de initiƫle frequente waarden te bepalen. Daarom kunnen de resultaten enigszins verschillen tussen meerdere uitvoeringen voor patronen waarvan de frequentie dicht bij de drempelwaarde ligt.
Voorbeeld
StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2)
Uitvoer
SegmentId | Count | Percentage | Staat | EventType | Schade | DamageCrops |
---|---|---|---|---|---|---|
0 | 4574 | 77.7 | NO | 0 | ||
1 | 2278 | 38.7 | Hagel | NO | 0 | |
2 | 5675 | 96.4 | 0 | |||
3 | 2371 | 40.3 | Hagel | 0 | ||
4 | 1279 | 21.7 | Onweerswind | 0 | ||
5 | 2468 | 41.9 | Hagel | |||
6 | 1310 | 22,3 | JA | |||
7 | 1291 | 21.9 | Onweerswind |
Voorbeeld met aangepaste jokertekens
StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2, '~', '~', '*', int(-1))
Uitvoer
SegmentId | Count | Percentage | Staat | EventType | Schade | DamageCrops |
---|---|---|---|---|---|---|
0 | 4574 | 77.7 | * | * | NO | 0 |
1 | 2278 | 38.7 | * | Hagel | NO | 0 |
2 | 5675 | 96.4 | * | * | * | 0 |
3 | 2371 | 40.3 | * | Hagel | * | 0 |
4 | 1279 | 21.7 | * | Onweerswind | * | 0 |
5 | 2468 | 41.9 | * | Hagel | * | -1 |
6 | 1310 | 22,3 | * | * | JA | -1 |
7 | 1291 | 21.9 | * | Onweerswind | * | -1 |
Feedback
https://aka.ms/ContentUserFeedback.
Binnenkort beschikbaar: In de loop van 2024 zullen we GitHub-problemen geleidelijk uitfaseren als het feedbackmechanisme voor inhoud en deze vervangen door een nieuw feedbacksysteem. Zie voor meer informatie:Feedback verzenden en weergeven voor