basket, plug-in
Le basket
plug-in recherche des modèles fréquents d’attributs dans les données et retourne les modèles qui dépassent un seuil de fréquence dans ces données. Un modèle représente un sous-ensemble des lignes qui ont la même valeur sur une ou plusieurs colonnes. Le basket
plug-in est basé sur l’algorithme Apriori développé à l’origine pour l’exploration de données d’analyse du panier.
Syntax
T | evaluate
basket
(
[ Seuil,
WeightColumn,
MaxDimensions,
CustomWildcard,
CustomWildcard,
... ])
Découvrez les conventions de syntaxe.
Paramètres
Nom | Type | Obligatoire | Description |
---|---|---|---|
Seuil | long |
double dans la plage de 0,015 à 1 qui définit le ratio minimal des lignes à considérer comme fréquentes. Les modèles avec un ratio plus petit ne sont pas retournés. La valeur par défaut est 0,05. Pour utiliser la valeur par défaut, entrez le tilde : ~ .Exemple : T | evaluate basket(0.02) |
|
WeightColumn | string |
Nom de colonne à utiliser pour prendre en compte chaque ligne de l’entrée en fonction du poids spécifié. Doit être un nom d’une colonne de type numérique, telle que int , long , real . Par défaut, chaque ligne a un poids de 1. Pour utiliser la valeur par défaut, entrez le tilde : ~ . Il est courant d’utiliser une colonne de pondération en prenant en compte l’échantillonnage ou la création de compartiments/l’agrégation des données déjà incorporées dans chaque ligne.Exemple : T | evaluate basket('~', sample_Count) |
|
MaxDimensions | int |
Définit le nombre maximal de dimensions non corrélées par panier, limité par défaut, pour réduire le runtime de requête. La valeur par défaut est 5. Pour utiliser la valeur par défaut, entrez le tilde : ~ .Exemple : T | evaluate basket('~', '~', 3) |
|
CustomWildcard | string |
Définit la valeur de caractère générique pour un type spécifique dans la table de résultats qui indique que le modèle actuel ne présente pas de restriction sur cette colonne. La valeur par défaut est à l’exception null des colonnes de chaîne dont la valeur par défaut est une chaîne vide. Si la valeur par défaut est une bonne valeur dans les données, une autre valeur générique doit être utilisée, telle que * . Pour utiliser la valeur par défaut, entrez le tilde : ~ .Exemple : T | evaluate basket('~', '~', '~', '*', int(-1), double(-1), long(0), datetime(1900-1-1)) |
Notes
Pour spécifier un paramètre facultatif qui suit un paramètre facultatif, veillez à fournir une valeur pour le paramètre facultatif précédent. Pour plus d’informations, consultez Utilisation de paramètres facultatifs.
Retours
Le basket
plug-in retourne des modèles fréquents qui dépassent un seuil de ratio. Le seuil par défaut est 0,05.
Chaque modèle est représenté par une ligne dans les résultats. La première colonne est l’ID de segment. Les deux colonnes suivantes sont le nombre et le pourcentage de lignes de la requête d’origine qui correspondent au modèle. Les colonnes restantes sont liées à la requête d’origine, avec une valeur spécifique de la colonne ou une valeur générique, qui est null par défaut, c’est-à-dire une valeur variable.
Notes
L’algorithme utilise l’échantillonnage pour déterminer les valeurs fréquentes initiales. Par conséquent, les résultats peuvent légèrement différer entre plusieurs exécutions pour des modèles dont la fréquence est proche du seuil.
Exemple
StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2)
Sortie
ID de segment | Count | Pourcentage | État | Type d’événement | Dommage | Récoltes |
---|---|---|---|---|---|---|
0 | 4574 | 77,7 | Non | 0 | ||
1 | 2278 | 38,7 | Grêle | Non | 0 | |
2 | 5675 | 96,4 | 0 | |||
3 | 2371 | 40,3 | Grêle | 0 | ||
4 | 1279 | 21,7 | Vent d’orage | 0 | ||
5 | 2468 | 41,9 | Grêle | |||
6 | 1310 | 22,3 | YES | |||
7 | 1291 | 21,9 | Vent d’orage |
Exemple avec des caractères génériques personnalisés
StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2, '~', '~', '*', int(-1))
Sortie
ID de segment | Count | Pourcentage | État | Type d’événement | Dommage | Récoltes |
---|---|---|---|---|---|---|
0 | 4574 | 77,7 | * | * | Non | 0 |
1 | 2278 | 38,7 | * | Grêle | Non | 0 |
2 | 5675 | 96,4 | * | * | * | 0 |
3 | 2371 | 40,3 | * | Grêle | * | 0 |
4 | 1279 | 21,7 | * | Vent d’orage | * | 0 |
5 | 2468 | 41,9 | * | Grêle | * | -1 |
6 | 1310 | 22,3 | * | * | YES | -1 |
7 | 1291 | 21,9 | * | Vent d’orage | * | -1 |
Commentaires
https://aka.ms/ContentUserFeedback.
Bientôt disponible : Tout au long de 2024, nous allons supprimer progressivement GitHub Issues comme mécanisme de commentaires pour le contenu et le remplacer par un nouveau système de commentaires. Pour plus d’informations, consultezEnvoyer et afficher des commentaires pour