你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

top-hitters 运算符

返回输入中最常用的非重复值或具有最大和的值的近似值。

注意

top-hitters 使用在输入数据较大时针对性能进行优化的近似算法。 近似值基于 Count-Min-Sketch 算法。

语法

T|top-hittersNumberOfValuesofValueExpression [ bySummingExpression ]

详细了解语法约定

参数

名称 类型 必需 说明
T string ✔️ 输入表格表达式。
NumberOfValues int、long 或 real ✔️ ValueExpression 的非重复值的数目。
ValueExpression string ✔️ 返回非重复值的输入表 T 上的表达式。
SummingExpression string 如果指定此项,则输入表 T 上的数值表达式,其每个 ValueExpression 非重复值的总和将建立要发出的值。 如果未指定,则改为使用 ValueExpression 的每个非重复值的计数。

备注

第一种语法(无 SummingExpression)在概念上等效于:

TsummarizeC``=``count()bysummarize|topC``=``count() by Cdesc

第二种语法(带有 SummingExpression)在概念上等效于:

TsummarizeS``=``sum(*SummingExpression*)bysummarize|topS``=``sum(*SummingExpression*) by Sdesc

示例

获取最频繁的项

下一个示例演示了如何查找前 5 大风暴类型。

StormEvents
| top-hitters 5 of EventType 

输出

EventType approximate_count_EventType
雷雨大风 13015
冰雹 12711
山洪 3688
Drought 3616
冬季天气 3349

获取排名最靠前的项(基于列值)

下一个示例演示了如何查找“Thunderstorm Wind”事件最多的州。

StormEvents
| where EventType == "Thunderstorm Wind"
| top-hitters 10 of State 

输出

状态 approximate_sum_State
德克萨斯 830
佐治亚州 609
密歇根州 602
衣阿华州 585
宾夕法尼亚州 549
ILLINOIS 533
NEW YORK 502
弗吉尼亚州 482
KANSAS 476
俄亥俄州 455