Partager via


basket, plug-in

Le basket plug-in recherche des modèles fréquents d’attributs dans les données et retourne les modèles qui passent un seuil de fréquence dans ces données. Un modèle représente un sous-ensemble des lignes qui ont la même valeur sur une ou plusieurs colonnes. Le basket plug-in est basé sur l’algorithme Apriori développé à l’origine pour l’exploration de données d’analyse du panier.

Syntaxe

Tevaluate ( | basket [ Threshold, WeightColumn, MaxDimensions, CustomWildcard CustomWildcard, , ... ])

En savoir plus sur les conventions de syntaxe.

Paramètres

Nom Type Requise Description
Seuil long Dans double la plage de 0,015 à 1 qui définit le ratio minimal des lignes à considérer comme fréquents. Les modèles avec un ratio plus petit ne seront pas retournés. La valeur par défaut est 0,05. Pour utiliser la valeur par défaut, entrez le tilde : ~.

Exemple : T | evaluate basket(0.02)
WeightColumn string Nom de colonne à utiliser pour prendre en compte chaque ligne de l’entrée en fonction du poids spécifié. Doit être un nom d’une colonne de type numérique, telle que int, longreal. Par défaut, chaque ligne a un poids de 1. Pour utiliser la valeur par défaut, entrez le tilde : ~. Il est courant d’utiliser une colonne de pondération en prenant en compte l’échantillonnage ou la création de compartiments/l’agrégation des données déjà incorporées dans chaque ligne.

Exemple : T | evaluate basket('~', sample_Count)
MaxDimensions int Définit le nombre maximal de dimensions non liées par panier, limitées par défaut, pour réduire le runtime de requête. La valeur par défaut est 5. Pour utiliser la valeur par défaut, entrez le tilde : ~.

Exemple : T | evaluate basket('~', '~', 3)
CustomWildcard string Définit la valeur de caractère générique pour un type spécifique dans la table de résultats qui indique que le modèle actuel ne présente pas de restriction sur cette colonne. La valeur par défaut est null à l’exception des colonnes de chaîne dont la valeur par défaut est une chaîne vide. Si la valeur par défaut est une bonne valeur dans les données, une autre valeur générique doit être utilisée, par *exemple . Pour utiliser la valeur par défaut, entrez le tilde : ~.

Exemple : T | evaluate basket('~', '~', '~', '*', int(-1), double(-1), long(0), datetime(1900-1-1))

Remarque

Pour spécifier un paramètre facultatif qui suit un paramètre facultatif, veillez à fournir une valeur pour le paramètre facultatif précédent. Pour plus d’informations, consultez Utilisation des paramètres facultatifs.

Retours

Le basket plug-in retourne des modèles fréquents qui passent un seuil de ratio. Le seuil par défaut est 0,05.

Chaque modèle est représenté par une ligne dans les résultats. La première colonne est l’ID de segment. Les deux colonnes suivantes sont le nombre et le pourcentage de lignes, à partir de la requête d’origine qui correspond au modèle. Les colonnes restantes sont liées à la requête d’origine, avec une valeur spécifique de la colonne ou une valeur générique, qui est par défaut null, ce qui signifie une valeur de variable.

Remarque

L’algorithme utilise l’échantillonnage pour déterminer les valeurs fréquentes initiales. Par conséquent, les résultats peuvent légèrement différer entre plusieurs exécutions pour les modèles dont la fréquence est proche du seuil.

Exemple

StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2)

Sortie

ID de segment Count Pourcentage État Type d’événement Dommage Récoltes
0 4574 77,7 NO 0
1 2278 38,7 Grêle NO 0
2 5675 96,4 0
3 2371 40,3 Grêle 0
4 1279 21,7 Vent d’orage 0
5 2468 41,9 Grêle
6 1310 22.3 OUI
7 1291 21,9 Vent d’orage

Exemple avec des caractères génériques personnalisés

StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2, '~', '~', '*', int(-1))

Sortie

ID de segment Count Pourcentage État Type d’événement Dommage Récoltes
0 4574 77,7 * * NO 0
1 2278 38,7 * Grêle NO 0
2 5675 96,4 * * * 0
3 2371 40,3 * Grêle * 0
4 1279 21,7 * Vent d’orage * 0
5 2468 41,9 * Grêle * -1
6 1310 22.3 * * OUI -1
7 1291 21,9 * Vent d’orage * -1