opérateur summarize

2025-05-20

S’applique à : ✅Microsoft Fabric

Génère une table qui agrège le contenu de la table d’entrée.

Syntaxe

T| summarize [ SummarizeParameters ] [[Colonne=] Agrégation [, ...]] [by [Colonne=] GroupExpression [, ...]]

En savoir plus sur les conventions de syntaxe.

Paramètres

Nom	Catégorie	Requise	Descriptif
Colonne	`string`		Le nom de la colonne de résultat. Prend par défaut un nom dérivé de l’expression.
Agrégation	`string`	✔️	appel d'une fonction d'agrégation telle que `count()` ou `avg()`, avec des noms de colonne comme arguments.
Expression_groupe	scalaire	✔️	expression scalaire qui peut faire référence aux données d’entrée. La sortie comporte autant d’enregistrements qu’il existe des valeurs distinctes de toutes les expressions de groupe.
Paramètres_synthèse	`string`		Zéro ou plusieurs paramètres séparés par l’espace sous la forme de valeur de nom `=` qui contrôlent le comportement. Consultez Paramètres pris en charge.

Notes

Lorsque la table d’entrée est vide, la sortie varie selon que GroupExpression est utilisé :

Si GroupExpression n’est pas fourni, la sortie est une seule ligne (vide).
Si GroupExpression est fourni, la sortie n’a aucune ligne.

Paramètres pris en charge

Nom	Descriptif
`hint.num_partitions`	Spécifie le nombre de partitions utilisées pour partager la charge de requête sur les nœuds de cluster. Voir requête de lecture aléatoire
`hint.shufflekey=<key>`	La requête `shufflekey` partage la charge de requête sur les nœuds de cluster à l’aide d’une clé pour partitionner les données. Voir requête de lecture aléatoire
`hint.strategy=shuffle`	La requête de stratégie `shuffle` partage la charge de requête sur les nœuds de cluster, où chaque nœud traite une partition des données. Voir requête de lecture aléatoire

Retours

Les lignes d’entrée sont organisées en groupes ayant les mêmes valeurs que les expressions by . Ensuite, les fonctions d’agrégation spécifiées sont calculées sur chaque groupe, générant une ligne pour chaque groupe. Le résultat contient les colonnes by et au moins une colonne pour chaque agrégation calculée. (Certaines fonctions d’agrégation retournent plusieurs colonnes.)

Le résultat a autant de lignes qu’il existe des combinaisons distinctes de by valeurs (qui peuvent être zéro). Si aucune clé de groupe n’est fournie, le résultat comporte un seul enregistrement.

Pour générer une synthèse sur des plages de valeurs numériques, utilisez bin() pour limiter les plages aux valeurs discrètes.

Notes

Bien que vous puissiez fournir des expressions arbitraires pour les expressions d’agrégation et de regroupement, il est plus efficace d’utiliser des noms de colonne simples ou d’appliquer bin() à une colonne numérique.
Les compartiments horaires automatiques pour les colonnes datetime ne sont plus pris en charge. Utilisez à la place le binning explicite. Par exemple : summarize by bin(timestamp, 1h).

Valeurs par défaut des agrégations

Le tableau suivant récapitule les valeurs par défaut des agrégations :

Opérateur	Valeur par défaut
`count()`, , `countif()`, , `dcount()dcountif()count_distinct()sum()sumif()variance()varianceif()stdev()stdevif()`	0
`make_bag()`, , `make_bag_if()`, `make_list()make_list_if()`, , `make_set()make_set_if()`	tableau dynamique vide ([])
Tous les autres	zéro

Notes

Lorsque vous appliquez ces agrégats à des entités qui incluent des valeurs null, les valeurs null sont ignorées et ne sont pas prises en compte dans le calcul. Consultez Exemples.

Exemples

Les exemples de cet article utilisent des tables disponibles publiquement dans le cluster d’aide, comme la table StormEvents dans la base de données Exemples.

Les exemples de cet article utilisent des tables disponibles publiquement, telles que la table StormEvents dans l’analyse météo exemples de données.

L’exemple suivant détermine les combinaisons uniques des StateEventType tempêtes qui ont entraîné des blessures directes. Il n’existe aucune fonction d’agrégation, mais uniquement des clés de regroupement. La sortie affiche uniquement les colonnes de ces résultats.

Exécuter la requête

StormEvents
| where InjuriesDirect > 0
| summarize by State, EventType

Sortie

Le tableau suivant montre uniquement les 5 premières lignes. Pour voir la sortie complète, exécutez la requête.

État	Type d’événement
TEXAS	Vent d’orage
TEXAS	Crue soudaine
TEXAS	Météo hivernale
TEXAS	Vent fort
TEXAS	Crue
...	...

L’exemple suivant recherche les tempêtes de pluies minimales et maximales à Hawaii. Comme il n’y a pas de clause group-by, la sortie contient une seule ligne.

Exécuter la requête

StormEvents
| where State == "HAWAII" and EventType == "Heavy Rain"
| project Duration = EndTime - StartTime
| summarize Min = min(Duration), Max = max(Duration)

Sortie

Min	Max
01:08:00	11:55:00

L’exemple suivant calcule le nombre de types d’événements storm uniques pour chaque état et trie les résultats en fonction du nombre de types storm uniques :

Exécuter la requête

StormEvents
| summarize TypesOfStorms=dcount(EventType) by State
| sort by TypesOfStorms

Sortie

Le tableau suivant montre uniquement les 5 premières lignes. Pour voir la sortie complète, exécutez la requête.

État	TypesOfStorms
TEXAS	27
CALIFORNIE	26
PENNSYLVANIE	25
GEORGIE	Vingt-quatre
ILLINOIS	23
...	...

L’exemple suivant calcule un histogramme des types d’événements orageux qui ont enregistré des tempêtes de plus de 1 jour. Étant donné que Duration a de nombreuses valeurs, utilisez bin() pour regrouper ses valeurs par intervalles de 1 jour.

Exécuter la requête

StormEvents
| project EventType, Duration = EndTime - StartTime
| where Duration > 1d
| summarize EventCount=count() by EventType, Length=bin(Duration, 1d)
| sort by Length

Sortie

Type d’événement	Longueur	Nombre d'événements
Sécheresse	30.00:00:00	1646
Feu de forêt	30.00:00:00	11
Chauffage	30.00:00:00	14
Crue	30.00:00:00	20
Fortes précipitations	29.00:00:00	42
...	...	...

L’exemple suivant montre les valeurs par défaut des agrégats lorsque la table d’entrée est vide. L’opérateur summarize est utilisé pour calculer les valeurs par défaut des agrégats. Lorsque l’entrée de l’opérateur summarize a au moins une clé de regroupement vide, le résultat est également vide.

Lorsque l’entrée de l’opérateur summarize n’a pas de clé de regroupement vide, le résultat inclut les valeurs par défaut des agrégations utilisés dans summarize Pour plus d’informations, consultez Valeurs par défaut des agrégations.

Exécuter la requête

datatable(x:long)[]
| summarize any_x=take_any(x), arg_max_x=arg_max(x, *), arg_min_x=arg_min(x, *), avg(x), buildschema(todynamic(tostring(x))), max(x), min(x), percentile(x, 55), hll(x) ,stdev(x), sum(x), sumif(x, x > 0), tdigest(x), variance(x)

Sortie

any_x	arg_max_x	arg_min_x	avg_x	schema_x	max_x	min_x	percentile_x_55	hll_x	stdev_x	sum_x	sumif_x	tdigest_x	variance_x
			NAN						0	0	0		0

Le résultat de avg_x(x) est NaN dû à la division par 0.

Exécuter la requête

datatable(x:long)[]
| summarize  count(x), countif(x > 0) , dcount(x), dcountif(x, x > 0)

Sortie

count_x	countif_	dcount_x	dcountif_x
0	0	0	0

Exécuter la requête

datatable(x:long)[]
| summarize  make_set(x), make_list(x)

Sortie

set_x	list_x
[]	[]

L’agrégation moyenne additionne uniquement les valeurs non null et compte uniquement ces valeurs dans son calcul, ignorant les valeurs Null.

Exécuter la requête

range x from 1 to 4 step 1
| extend y = iff(x == 1, real(null), real(5))
| summarize sum(y), avg(y)

Sortie

sum_y	avg_y
15	5

La fonction de nombre standard inclut des valeurs Null dans son nombre :

Exécuter la requête

range x from 1 to 2 step 1
| extend y = iff(x == 1, real(null), real(5))
| summarize count(y)

Sortie

count_y
2

Exécuter la requête

range x from 1 to 2 step 1
| extend y = iff(x == 1, real(null), real(5))
| summarize make_set(y), make_set(y)

Sortie

set_y	set_y1
[5.0]	[5.0]

Partager via

opérateur summarize

Syntaxe

Paramètres

Paramètres pris en charge

Retours

Valeurs par défaut des agrégations

Exemples

Commentaires

Ressources supplémentaires