diffpatterns_text プラグイン
文字列値の 2 つのデータセットを比較し、2 つのデータセット間の違いを特徴付けするテキスト パターンを検索します。 このプラグインは、evaluate
演算子*を使用して呼び出し*ます。
は diffpatterns_text
、2 つのセット内のデータのさまざまな部分をキャプチャするテキスト パターンのセットを返します。 たとえば、条件が の場合は行の大きな割合をキャプチャし、条件が の場合は true
行の割合が低いパターンです false
。 パターンは、空白で区切られた連続するトークンから構築され、テキスト列のトークンまたはワイルドカードを表す が *
使用されます。 各パターンは、結果内の行によって表されます。
構文
T | evaluate diffpatterns_text(
TextColumn, BooleanCondition [, MinTokens, Threshold , MaxTokens])
構文規則について詳しく知る。
パラメーター
名前 | 型 | 必須 | 説明 |
---|---|---|---|
TextColumn | string |
✔️ | 分析するテキスト列。 |
BooleanCondition | string |
✔️ | ブール値に評価される式。 アルゴリズムは、この式に基づいて比較する 2 つのデータセットにクエリを分割します。 |
MinTokens | int |
結果パターンごとのワイルドカード以外のトークンの最小数を表す 0 ~ 200 の整数値。 既定値は 1 です。 | |
しきい値 | decimal |
0.015 ~ 1 の 10 進数の値で、2 つのセット間の最小パターン比の差を設定します。 既定値は 0.05 です。 「diffpatterns」を参照してください。 | |
MaxTokens | int |
結果パターンあたりのトークンの最大数を設定する 0 ~ 20 の整数値で、下限を指定するとクエリ ランタイムが減少します。 |
戻り値
diffpatterns_text の結果は次の列を返します。
- Count_of_True: 条件が
true
の場合に、パターンに一致する行の数。 - Count_of_False: 条件が
false
の場合に、パターンに一致する行の数。 - Percent_of_True: 条件が
true
の場合に、行からのパターンに一致する行の割合。 - Percent_of_False: 条件が
false
の場合に、行からのパターンに一致する行の割合。 - Pattern: テキスト文字列からのトークンと、ワイルドカードの場合は '
*
' を含むテキスト パターン。
Note
パターンは必ずしも異なるわけではなく、データセットの完全なカバレッジを提供しない場合があります。 パターンは重複していることがあり、一部の行はどのパターンとも一致しない場合があります。
例
次の例では、ヘルプ クラスターの StormEvents テーブルのデータを使用します。 このデータにアクセスするには、https://dataexplorer.azure.com/clusters/help/databases/Samples にサインインします。 左側のメニューで、help>Samples>Tables>Storm_Events を参照します。
StormEvents
| where EventNarrative != "" and monthofyear(StartTime) > 1 and monthofyear(StartTime) < 9
| where EventType == "Drought" or EventType == "Extreme Cold/Wind Chill"
| evaluate diffpatterns_text(EpisodeNarrative, EventType == "Extreme Cold/Wind Chill", 2)
出力
Count_of_True | Count_of_False | Percent_of_True | Percent_of_False | パターン |
---|---|---|---|---|
11 | 0 | 6.29 | 0 | Winds shifting northwest in * wake * a surface trough brought heavy lake effect snowfall downwind * Lake Superior from |
9 | 0 | 5.14 | 0 | Canadian high pressure settled * * region * produced the coldest temperatures since February * 2006. Durations * freezing temperatures |
0 | 34 | 0 | 6.24 | * * * * * * * * * * * * * * * * * * West Tennessee, |
0 | 42 | 0 | 7.71 | * * * * * * caused * * * * * * * * across western Colorado. * |
0 | 45 | 0 | 8.26 | * * below normal * |
0 | 110 | 0 | 20.18 | Below normal * |
フィードバック
https://aka.ms/ContentUserFeedback」を参照してください。
以下は間もなく提供いたします。2024 年を通じて、コンテンツのフィードバック メカニズムとして GitHub の issue を段階的に廃止し、新しいフィードバック システムに置き換えます。 詳細については、「フィードバックの送信と表示