Share via


diffpatterns_text プラグイン

文字列値の 2 つのデータセットを比較し、2 つのデータセット間の違いを特徴付けするテキスト パターンを検索します。 このプラグインは、evaluate演算子*を使用して呼び出し*ます。

diffpatterns_text 、2 つのセット内のデータのさまざまな部分をキャプチャするテキスト パターンのセットを返します。 たとえば、条件が の場合は行の大きな割合をキャプチャし、条件が の場合は true 行の割合が低いパターンです false。 パターンは、空白で区切られた連続するトークンから構築され、テキスト列のトークンまたはワイルドカードを表す が * 使用されます。 各パターンは、結果内の行によって表されます。

構文

T | evaluate diffpatterns_text(TextColumn, BooleanCondition [, MinTokens, Threshold , MaxTokens])

構文規則について詳しく知る。

パラメーター

名前 必須 説明
TextColumn string ✔️ 分析するテキスト列。
BooleanCondition string ✔️ ブール値に評価される式。 アルゴリズムは、この式に基づいて比較する 2 つのデータセットにクエリを分割します。
MinTokens int 結果パターンごとのワイルドカード以外のトークンの最小数を表す 0 ~ 200 の整数値。 既定値は 1 です。
しきい値 decimal 0.015 ~ 1 の 10 進数の値で、2 つのセット間の最小パターン比の差を設定します。 既定値は 0.05 です。 「diffpatterns」を参照してください。
MaxTokens int 結果パターンあたりのトークンの最大数を設定する 0 ~ 20 の整数値で、下限を指定するとクエリ ランタイムが減少します。

戻り値

diffpatterns_text の結果は次の列を返します。

  • Count_of_True: 条件が true の場合に、パターンに一致する行の数。
  • Count_of_False: 条件が false の場合に、パターンに一致する行の数。
  • Percent_of_True: 条件が true の場合に、行からのパターンに一致する行の割合。
  • Percent_of_False: 条件が false の場合に、行からのパターンに一致する行の割合。
  • Pattern: テキスト文字列からのトークンと、ワイルドカードの場合は '*' を含むテキスト パターン。

Note

パターンは必ずしも異なるわけではなく、データセットの完全なカバレッジを提供しない場合があります。 パターンは重複していることがあり、一部の行はどのパターンとも一致しない場合があります。

次の例では、ヘルプ クラスターの StormEvents テーブルのデータを使用します。 このデータにアクセスするには、https://dataexplorer.azure.com/clusters/help/databases/Samples にサインインします。 左側のメニューで、help>Samples>Tables>Storm_Events を参照します。

StormEvents     
| where EventNarrative != "" and monthofyear(StartTime) > 1 and monthofyear(StartTime) < 9
| where EventType == "Drought" or EventType == "Extreme Cold/Wind Chill"
| evaluate diffpatterns_text(EpisodeNarrative, EventType == "Extreme Cold/Wind Chill", 2)

出力

Count_of_True Count_of_False Percent_of_True Percent_of_False パターン
11 0 6.29 0 Winds shifting northwest in * wake * a surface trough brought heavy lake effect snowfall downwind * Lake Superior from
9 0 5.14 0 Canadian high pressure settled * * region * produced the coldest temperatures since February * 2006. Durations * freezing temperatures
0 34 0 6.24 * * * * * * * * * * * * * * * * * * West Tennessee,
0 42 0 7.71 * * * * * * caused * * * * * * * * across western Colorado. *
0 45 0 8.26 * * below normal *
0 110 0 20.18 Below normal *