共用方式為


autocluster 外掛程式

autocluster 會尋找資料中離散屬性 (維度) 的通用模式。 然後,它會將原始查詢的結果減少為100或100,000個數據列,到幾個模式。 外掛程式是開發來協助分析失敗 (,例如例外狀況或當機) ,但可能可在任何篩選的數據集上運作。 使用 evaluate 運算子叫用外掛程式。

注意

autocluster 主要是以下列文件中的 Seed-Expand 演算法為基礎:使用離散屬性的遙測資料採礦演算法

語法

T|evaluateautocluster([SizeWeight [,WeightColumn [NumSeeds [,,CustomWildcard [, ... ]]]]])

深入瞭解 語法慣例

參數

參數必須依照 語法中指定的順序排序。 若要指出應該使用預設值,請將字串波浪圖值 ~放入 。 如需詳細資訊,請參閱 範例

名稱 類型 必要 Description
T string ✔️ 輸入表格式表達式。
SizeWeight double 介於 0 和 1 之間的雙精度浮點數,可控制泛型 (高涵蓋範圍) 與資訊 (許多共用) 值的平衡。 增加此值通常會在擴充涵蓋範圍時減少模式的數量。 相反地,減少此值會產生更特定的模式,其特性是增加的共用值和較小的百分比涵蓋範圍。 預設為 0.5。 公式是具有權數和1-SizeWeightSizeWeight加權幾何平均數。
WeightColumn string 會根據指定的權數考慮輸入中的每個資料列。 每個資料列的預設權數為 1。 自變數必須是數值整數數據行的名稱。 加權數據行的常見用法是考慮已內嵌至每個數據列的數據取樣或貯體或匯總。
NumSeeds int 決定初始本機搜尋點的數目。 根據數據結構調整種子影響的結果數量或品質。 增加種子可以增強結果,但查詢取捨較慢。 減少低於五個會產生可忽略的改善,而增加超過50則很少會產生更多模式。 預設為 25
CustomWildcard string 類型常值,設定結果數據表中特定類型的通配符值,表示此數據行沒有限制。 預設值為 null,表示空字串。 如果預設值是資料中的可用值,則需使用不同的萬用字元值 (例如 *)。 您可以連續新增多個自訂通配符。

傳回

外掛程式 autocluster 通常會傳回一組小型模式。 模式會擷取有橫跨多個離散屬性共用常見值的部分資料。 每個模式會以結果中的一個資料列表示。

第一個資料行是區段識別碼。 下兩個資料行是原始查詢中由模式所擷取之資料列的計數和百分比。 其餘的資料行是來自原始查詢。 其值是資料行中的特定值或表示變數值的萬用字元值 (預設為 Null)。

這些模式不相異、可能會重疊,而且通常不會涵蓋所有原始資料列。 某些資料列可能不會落在任何模式之下。

提示

在輸入管線中使用 whereproject,將資料減少到僅只您感興趣的資料。

當您找到有趣的資料列時,您可藉由將其特定值加入至您的 where 篩選器,進一步深入探索。

範例

使用評估

T | evaluate autocluster()

使用 autocluster

StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State , EventType , Damage
| evaluate autocluster(0.6)

輸出

SegmentId Count 百分比 EventType Damage
0 2278 38.7 Hail
1 512 8.7 Thunderstorm Wind YES
2 898 15.3 德克薩斯州

使用自訂萬用字元

StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State , EventType , Damage
| evaluate autocluster(0.2, '~', '~', '*')

輸出

SegmentId Count 百分比 EventType Damage
0 2278 38.7 * Hail
1 512 8.7 * Thunderstorm Wind YES
2 898 15.3 德克薩斯州 * *