Share via


basket, plug-in

Le basket plug-in recherche des modèles fréquents d’attributs dans les données et retourne les modèles qui dépassent un seuil de fréquence dans ces données. Un modèle représente un sous-ensemble des lignes qui ont la même valeur sur une ou plusieurs colonnes. Le basket plug-in est basé sur l’algorithme Apriori développé à l’origine pour l’exploration de données d’analyse du panier.

Syntax

T | evaluatebasket([ Seuil,WeightColumn,MaxDimensions,CustomWildcard,CustomWildcard, ... ])

Découvrez les conventions de syntaxe.

Paramètres

Nom Type Obligatoire Description
Seuil long double dans la plage de 0,015 à 1 qui définit le ratio minimal des lignes à considérer comme fréquentes. Les modèles avec un ratio plus petit ne sont pas retournés. La valeur par défaut est 0,05. Pour utiliser la valeur par défaut, entrez le tilde : ~.

Exemple : T | evaluate basket(0.02)
WeightColumn string Nom de colonne à utiliser pour prendre en compte chaque ligne de l’entrée en fonction du poids spécifié. Doit être un nom d’une colonne de type numérique, telle que int, long, real. Par défaut, chaque ligne a un poids de 1. Pour utiliser la valeur par défaut, entrez le tilde : ~. Il est courant d’utiliser une colonne de pondération en prenant en compte l’échantillonnage ou la création de compartiments/l’agrégation des données déjà incorporées dans chaque ligne.

Exemple : T | evaluate basket('~', sample_Count)
MaxDimensions int Définit le nombre maximal de dimensions non corrélées par panier, limité par défaut, pour réduire le runtime de requête. La valeur par défaut est 5. Pour utiliser la valeur par défaut, entrez le tilde : ~.

Exemple : T | evaluate basket('~', '~', 3)
CustomWildcard string Définit la valeur de caractère générique pour un type spécifique dans la table de résultats qui indique que le modèle actuel ne présente pas de restriction sur cette colonne. La valeur par défaut est à l’exception null des colonnes de chaîne dont la valeur par défaut est une chaîne vide. Si la valeur par défaut est une bonne valeur dans les données, une autre valeur générique doit être utilisée, telle que *. Pour utiliser la valeur par défaut, entrez le tilde : ~.

Exemple : T | evaluate basket('~', '~', '~', '*', int(-1), double(-1), long(0), datetime(1900-1-1))

Notes

Pour spécifier un paramètre facultatif qui suit un paramètre facultatif, veillez à fournir une valeur pour le paramètre facultatif précédent. Pour plus d’informations, consultez Utilisation de paramètres facultatifs.

Retours

Le basket plug-in retourne des modèles fréquents qui dépassent un seuil de ratio. Le seuil par défaut est 0,05.

Chaque modèle est représenté par une ligne dans les résultats. La première colonne est l’ID de segment. Les deux colonnes suivantes sont le nombre et le pourcentage de lignes de la requête d’origine qui correspondent au modèle. Les colonnes restantes sont liées à la requête d’origine, avec une valeur spécifique de la colonne ou une valeur générique, qui est null par défaut, c’est-à-dire une valeur variable.

Notes

L’algorithme utilise l’échantillonnage pour déterminer les valeurs fréquentes initiales. Par conséquent, les résultats peuvent légèrement différer entre plusieurs exécutions pour des modèles dont la fréquence est proche du seuil.

Exemple

StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2)

Sortie

ID de segment Count Pourcentage État Type d’événement Dommage Récoltes
0 4574 77,7 Non 0
1 2278 38,7 Grêle Non 0
2 5675 96,4 0
3 2371 40,3 Grêle 0
4 1279 21,7 Vent d’orage 0
5 2468 41,9 Grêle
6 1310 22,3 YES
7 1291 21,9 Vent d’orage

Exemple avec des caractères génériques personnalisés

StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2, '~', '~', '*', int(-1))

Sortie

ID de segment Count Pourcentage État Type d’événement Dommage Récoltes
0 4574 77,7 * * Non 0
1 2278 38,7 * Grêle Non 0
2 5675 96,4 * * * 0
3 2371 40,3 * Grêle * 0
4 1279 21,7 * Vent d’orage * 0
5 2468 41,9 * Grêle * -1
6 1310 22,3 * * YES -1
7 1291 21,9 * Vent d’orage * -1