メトリックを構成して検出構成を微調整する
重要
2023 年 9 月 20 日以降は、新しい Metrics Advisor リソースを作成できなくなります。 Metrics Advisor サービスは、2026 年 10 月 1 日に廃止されます。
この記事では、Web ポータルを使用して Metrics Advisor インスタンスの構成を開始し、異常検出結果を微調整します。
メトリック
特定のデータ フィードのメトリックを参照するには、 [データ フィード] ページに移動し、フィードの 1 つを選択します。 これにより、関連付けられているメトリックの一覧が表示されます。
メトリック名の 1 つを選択すると、その詳細が表示されます。 このビューでは、画面の右上隅にあるドロップダウン リストを使用して、同じデータ フィード内の別のメトリックに切り替えることができます。
メトリックの詳細を初めて表示する場合、Metrics Advisor に 1 つを自動的に選択させるか、各ディメンションに含める値を指定することで、時系列を読み込むことができます。
時間の範囲を選択し、ページのレイアウトを変更することもできます。
Note
- 開始時刻は含まれます。
- 終了時刻は含まれません。
[インシデント] タブを選択して異常を表示し、インシデント ハブへのリンクを見つけることができます。
検出構成を調整する
メトリックに 1 つ以上の検出構成を適用できます。 各メトリックには既定の構成があり、監視のニーズに応じて編集または追加することができます。
異常検出に基づく検出構成の自動チューニング
検出構成の自動チューニングは、Metrics Advisor でリリースされた新機能であり、次のシナリオに対処するのに役立ちます。
ユース ケースに応じて、特定の種類の異常の方がより重要な関心事となる場合があります。 突然のスパイクやディップに興味を持つ場合もありますが、その他の場合、スパイク/ディップや一時的な異常は重要ではありません。 以前は、さまざまな異常の種類の構成を区別することは困難でした。 新しい自動チューニング機能により、この異常の種類の区別が可能になります。 現時点では、5 つの異常パターンがサポートされています。
- スパイク
- ディップ
- Increase (増加)
- 減少
- 安定
場合によっては、1 つのメトリック内に多数のディメンションが存在することがあり、メトリックは数百、数千、またはそれ以上の時系列に分割されて監視されます。 ただし、多くの場合、これらのディメンションの一部は同等に重要ではありません。 例えば、売上を例にとると、小さな地域や特定の製品カテゴリーの数は非常に小さいため、安定しない可能性があります。 しかし、同時に必ずしも重要ではありません。 新しい自動チューニング機能により、シリーズ値範囲に基づいて構成を微調整することができます。
これにより、構成を何度も微調整する手間が省け、アラートのノイズも軽減できます。
Note
自動チューニング機能は、"スマート検出" メソッドにのみ適用されます。
自動チューニングをトリガーするための前提条件
メトリックが Metrics Advisor にオンボードされると、システムは異常パターンの種類と系列値分布を分類するために、メトリックの統計を実行しようとします。 この機能を提供することで、特定の設定に基づいて構成をさらに微調整できます。 最初に、初期化中の状態が表示されます。
異常パターンと系列値に対して自動チューニングを有効にする
この機能を使用すると、異常パターンと系列値の 2 つの観点から検出構成を調整できます。 特定のユース ケースに基づいて、どちらを有効にするか、両方を有効にするかを選択できます。
異常パターン オプションの場合、メトリックで観察されたさまざまな異常パターンが一覧表示されます。 興味のあるパターンを選んで選択できます。選択されていないパターンは、既定で感度が低下します。
系列値オプションの場合、選択内容は特定のユース ケースによって異なります。 値が大きい系列には高い感度を使用し、値が小さい系列には感度を下げるか、またはその逆を行うかを決定する必要があります。 次に、チェック ボックスをオンにします。
選択した異常パターンの構成を調整する
特定の異常パターンを選択した場合、次の手順では、それぞれの構成を微調整します。 すべてのシリーズに適用されるグローバルな感度があります。 異常パターンごとに、グローバルな感度に基づいて調整を調整できます。
個別に選択された各異常パターンを調整する必要があります。
各系列値グループの構成を調整する
システムがメトリック内のすべての時系列の統計を生成すると、複数の系列値グループが自動的に作成されます。 前述のように、特定のビジネス ニーズに応じて、各系列値グループの調整を微調整できます。
最適な検出結果が得られるように既定の調整が構成されますが、さらに調整することもできます。
アラート ルールの設定
有効な異常のキャプチャに関する検出構成を調整した後でも、最終的なアラート ルールが最終的なビジネス ニーズを満たすことができるようにアラート ルールを入力することが重要です。 フィルター ルールや継続的アラート ルールの再通知など、多数のルールを設定できます。
上記のセクションで説明したすべての設定を構成した後、システムによってそれらが調整され、入力された設定に基づいて異常が自動的に検出されます。 目標は、各メトリックに最適な構成を取得することです。これは、新しい自動チューニング機能を使用することではるかに簡単に実現できます。
現在のメトリックのすべての系列について構成を調整する
この構成は、このメトリックのすべての系列に適用されます。ただし、個別の構成を持つものは除きます。 既定では、メトリック レベルの構成は、データがオンボードされるときに適用され、左側のパネルに表示されます。 ユーザーは、メトリックのページでメトリック レベルの構成を直接編集できます。
[方向] や [Valid anomaly](有効な異常) など、構成をさらに調整するために使用できる追加のパラメーターがあります。 さまざまな検出方法を組み合わせることもできます。
特定の系列またはグループの構成を調整する
メトリック レベルの構成オプションの下にある [詳細構成] を選択して、グループ レベルの構成を表示します。このウィンドウの + アイコンをクリックすると、個々の系列、または系列のグループに対して構成を追加できます。 パラメーターは、メトリック レベルの構成パラメーターと同様ですが、グループ レベルの構成では、系列のグループを識別するディメンション値を 1 つ以上指定することが必要な場合があります。 さらに、系列レベルの構成では、特定の系列を識別するディメンション値をすべて指定します。
この構成は、メトリック レベルの構成ではなく、系列のグループまたは特定の系列に適用されます。 このグループの条件を設定した後、保存します。
異常検出メソッド
Metrics Advisor には、ハードしきい値、スマート検出、しきい値の変更という複数の異常検出方法が用意されています。 1 つを使用するか、または '+' ボタンをクリックして、論理演算子を使用して複数を組み合わせることができます。
ハードしきい値
ハードしきい値は、異常検出の基本的な方法です。 上限または下限、あるいはその両方を設定して、期待される値の範囲を決定できます。 境界外のポイントはすべて、異常として識別されます。
スマート検出
スマート検出では、機械学習を利用して、履歴データからパターンを学習し、それらを将来の検出に使用します。 この方法を使用する場合、検出の結果を調整するために最も重要なパラメーターは、 [検出感度] です。 それを小さいまたは大きい値にドラッグして、ページの右側の視覚化に影響を与えることができます。 データに適合するものを選択して、保存します。
スマート検出モードでは、検出感度と境界のバージョン パラメーターを使用して、異常検出の結果を微調整します。
検出感度は、各ポイントの期待される値の範囲の幅に影響を与える可能性があります。 検出感度を上げると、期待される値の範囲は狭まり、報告される異常は多くなります。
検出感度を下げると、期待される値の範囲は広がり、報告される異常は少なくなります。
しきい値の変更
通常、しきい値の変更は、メトリック データが全般的に特定の範囲内にある場合に使用されます。 しきい値は、 [Change percentage](変化率) に応じて設定されます。 [Change threshold](しきい値の変更) モードを使用すると、次のシナリオで異常を検出できます。
- 通常、データは安定しており、平滑です。 変動がある場合に通知を受け取ります。
- 通常、データは不安定で、大きく変動します。 安定しすぎたり、平坦になったりしたときに通知を受け取ります。
このモードを使用するには、次の手順を実行します。
メトリックまたは時系列の異常検出構成を設定するときに、異常検出方法として [Change threshold](しきい値の変更) を選択します。
シナリオに基づいて、範囲外または範囲内パラメーターを選択します。
変動を検出する場合は、範囲外を選択します。 たとえば、次の設定を使用すると、前のデータ ポイントと比較して変化率が 10% を超えるすべてのデータ ポイントが外れ値として検出されます。
データ内の平坦な線を検出する場合は、範囲内を選択します。 たとえば、次の設定を使用すると、前のデータ ポイントと比較して変化率が 0.01% 内であるすべてのデータ ポイントが外れ値として検出されます。 しきい値は非常に小さい (0.01%) ため、データ内の平坦な線は外れ値として検出されます。
異常としてカウントされる変化率と、以前にキャプチャされ、比較に使用するデータ ポイントを設定します。 この比較は常に、現在のデータ ポイントと、それより N 個前の単一のデータ ポイントとの間で行われます。
[方向] は、範囲外モードを使用する場合にのみ有効です。
- [上] では、(現在のデータ ポイント) - (比較するデータ ポイント) >+ しきい値パーセンテージの場合にのみ異常を検出するように検出が構成されます。
- [下] では、(現在のデータ ポイント) - (比較するデータ ポイント) <- しきい値パーセントの場合にのみ異常を検出するように検出が構成されます。
事前設定イベント
場合によっては、予期されるイベントや出来事 (休日など) によって異常のデータが生成されることがあります。 事前設定イベントを使用すると、指定された時間中、異常検出の出力にフラグを追加できます。 この機能は、データ フィードのオンボード後に構成する必要があります。 各メトリックに構成できる事前設定イベントは 1 つのみです。
Note
事前設定イベントの構成では、異常検出中に休日が考慮され、結果が変わる可能性があります。 これは、この構成を保存した後に取り込まれるデータ ポイントに適用されます。
各メトリックの詳細ページで、メトリック ドロップダウン リストの横にある [事前設定イベントの構成] ボタンを選択します。
表示されたウィンドウで、使用状況に応じてオプションを構成します。 この構成を使用するには、 [Enable holiday event](休日イベントを有効にする) がオンになっていることを確認します。
[Holiday event](休日) セクションは、休日中に不要な異常が検出されるのを抑制するのに役立ちます。 適用できる [戦略] オプションとしては、次の 2 つのオプションがあります。
- [Suppress holiday](休日を抑制する) : 休日期間中、異常検出の結果内のすべての異常およびアラートを抑制します。
- [Holiday as weekend](週末としての休日) : 休日以前のいくつかの対応する週末の平均期待値を計算し、これらの値に基づいて異常状態を決定します。
この他にも構成できる値がいくつかあります。
オプション | 説明 |
---|---|
[Choose one dimension as country](国として 1 つのディメンションを選択する) | 国情報を含むディメンションを選択します。 たとえば、国番号などです。 |
[Country code mapping](国番号のマッピング) | 標準の国番号と選択されたディメンションの国データのマッピング。 |
[Holiday options](休日オプション) | すべての休日、PTO (有給休暇) のみ、PTO 以外の休日のみのいずれを考慮するかを指定します。 |
[拡張する日数] | 休日前後の影響を受ける日数。 |
一部のシナリオでは、データ内の循環パターンを使用して不要なアラートを削減するために、 [Cycle event](循環イベント) セクションを使用することができます。 次に例を示します。
- 週次と月次の両方のパターンなど、複数のパターンまたはサイクルを持つメトリック。
- 明確なパターンを持たないが、データを前年比 (YoY)、前月比 (MoM)、前週比 (WoW)、前日比 (DoD) で比較できるメトリック。
すべての細分性に対してすべてのオプションを選択できるとは限りません。 粒度ごとに使用可能なオプションは以下のとおりです (✔は使用可能、Xは使用不可)。
粒度 | YoY | MoM | WoW | DoD |
---|---|---|---|---|
年単位 | X | X | X | X |
月単位 | X | X | X | X |
週次 | ✔ | X | X | X |
毎日 | ✔ | ✔ | ✔ | X |
1 時間ごと | ✔ | ✔ | ✔ | ✔ |
1 分ごと | X | X | X | X |
1 秒ごと | X | X | X | X |
カスタム* | ✔ | ✔ | ✔ | ✔ |
秒単位のカスタム細分性を使用する場合、メトリックが 1 時間より長く、1 日未満の場合にのみ使用できます。
循環イベントは、循環パターンに従う場合に異常を削減するために使用されますが、複数のデータ ポイントがパターンに従わない場合は異常を報告します。 厳格モード は、1 つのデータ ポイントでもパターンに従わない場合に異常レポートを有効にするために使用されます。
最近のインシデントを表示する
Metrics Advisor では、取り込み時にすべての時系列データの異常を検出します。 ただし、必ずしもすべての異常が大きな影響を及ぼすとは限らないため、これらをすべてエスカレートする必要はありません。 異常に対して集計が実行され、関連性のある異常をインシデントにグループ化します。 これらのインシデントは、メトリックの詳細ページの [インシデント] タブを使用して表示できます。
インシデントを選択して、[インシデントの分析] ページに移動します。このページには、インシデントに関する詳細が表示されます。 [新しいインシデント ハブでインシデントを管理する] を選択して、[インシデント ハブ] ページを表示します。このページには、特定のメトリックのすべてのインシデントが表示されます。
通知のために異常をサブスクライブする
異常が検出されたときに常に通知を受信したい場合は、フックを使用して、メトリックに関するアラートをサブクライブすることができます。 詳細については、「フックを使用してアラートを構成し、通知を取得する」を参照してください。