次の方法で共有


Azure Stream Analytics のジョブ メトリック

Azure Stream Analytics には、クエリとジョブのパフォーマンスの監視とトラブルシューティングに使用できるメトリックが多数用意されています。 これらのメトリックのデータは、Azure portal の [概要] ページの [監視] セクションで確認できます。

Screenshot of the Azure portal that shows the section for monitoring Stream Analytics jobs.

特定のメトリックを確認する場合は、[監視]セクションで [メトリック] を選択します。 表示されるページで、[メトリック] を選択します。

Screenshot that shows selecting a metric in the Stream Analytics job monitoring dashboard.

Stream Analytics に利用できるメトリック

Azure Stream Analytics には、ジョブの正常性を監視するための次のメトリックが用意されています。

メトリック 定義
バックログされた入力イベント バックログされた入力イベントの数。 このメトリックの 0 以外の値は、ジョブが受信イベントの数に追いつかないことを意味します。 この値がゆっくり増加する場合や一貫して 0 以外である場合は、ジョブをスケールアウトする必要があります。 詳細については、「ストリーミング ユニットの理解と調整」を参照してください。
データ変換エラー 想定の出力スキーマに変換できなかった出力イベントの数。 このシナリオに発生したイベントを削除するには、エラー ポリシーを Drop に変更します。
CPU 使用率 (%) (プレビュー) ジョブが使用する CPU の割合。 この値が非常に高い (90% 以上) 場合でも、このメトリックのみに基づいて SU の数を増やすことはしないでください。 バックログされた入力イベントまたは透かしの遅延数が増えた場合は、このメトリックを使用して、CPU がボトルネックであるかどうかを判断できます。

このメトリックには、断続的なスパイクがある可能性があります。 スケール テストを実行して、CPU ボトルネックのために入力がバックログに記録されたり、透かしの遅延が増加したりするまでのジョブの上限を判断することをお勧めします。
初期入力イベント アプリケーション タイム スタンプが受信時間より 5 分以上早いイベント。
失敗した関数の要求 失敗した Azure Machine Learning 関数呼び出しの数 (存在する場合)。
関数のイベント Azure Machine Learning 関数に送られたイベントの数 (存在する場合)。
関数の要求 Azure Machine Learning 関数に対する呼び出しの数 (存在する場合)。
逆シリアル化の入力エラー 逆シリアル化できなかった入力イベントの数。
入力イベントのバイト数 Stream Analytics ジョブが受信するデータの量 (バイト単位)。 このメトリックを使用して、イベントが入力ソースに送信されていることを検証できます。
入力イベント 入力イベントから逆シリアル化されたレコードの数。 この数には、逆シリアル化エラーが発生する受信イベントは含みません。 Stream Analytics では、内部復旧や自己結合などのシナリオで、同じイベントを複数回取り込むことができます。 ジョブに単純なパススルー クエリがある場合、入力イベント メトリックと 出力イベント メトリックが一致すると予期しないようにしてください。
受信した入力ソース ジョブが受信するメッセージの数。 Azure Event Hubs の場合、メッセージは 1 つの EventData 項目です。 Azure Blob Storage の場合、メッセージは 1 つの BLOB です。

入力ソースは逆シリアル化の前にカウントされることにご注意ください。 逆シリアル化エラーが発生した場合、入力ソースは入力イベントよりも大きくなる場合があります。 それ以外の場合、各メッセージに複数のイベントが含まれる可能性があるため、入力ソースは入力イベント以下になる可能性があります。
遅延入力イベント 構成済みの到着遅延許容期間より後に到着したイベント。 詳細については Azure Stream Analytics のイベントの順序に関する考慮事項を確認してください。
順不同のイベント イベント順序ポリシーに基づいて、削除された、または調整されたタイムスタンプが付与された、順不同で受信したイベントの数。 このメトリックは、順不同の許容範囲ウィンドウ 設定の構成によって影響を受ける可能性があります。
出力イベント Stream Analytics ジョブが出力ターゲットに送信するデータ量 (イベント数)。
実行時エラー クエリ処理に関連するエラーの総数。 イベントの取り込み中や結果の出力中に見つかったエラーは除外されます。
SU (メモリ) 使用率 (%) ジョブが使用するメモリの割合。 このメトリックが常に 80% を超え、透かしの遅延が増加し、バックログされたイベントの数が増加している場合は、ストリーミング ユニット (SU) を増やすことを検討してください。 使用率が高い場合は、最大数に近い割り当てリソースがジョブによって使用されていることを示します。
基準値の遅延 ジョブ内のすべての出力のすべてのパーティションにわたる最大の透かし遅延。

監視するシナリオ

Azure Stream Analytics は、サーバーレスの分散ストリーミング処理サービスを提供します。 ジョブは、1 つまたは複数の分散ストリーミング ノードで実行でき、これらのノードがサービスによって自動的に管理されます。 入力データはパーティション分割され、異なるストリーミング ノードに割り当てられて処理されます。

メトリック 条件 時間の集計 しきい値 問題への対応
SU (メモリ) 使用率 (%) より大きい 平均 80 複数の要因により、SU の使用率が増加します。 クエリの並列処理を使用してスケーリングするか、SU 数を増やすことができます。 詳細については、「Azure Stream Analytics でのクエリの並列処理の活用」を参照してください。
CPU 使用率 (%) より大きい 平均 90 これは、一部の操作 (ユーザー定義関数、ユーザー定義の集計、複雑な入力の逆シリアル化など) が多くの CPU サイクルを必要とすることを意味する可能性があります。 この問題は、通常、ジョブの SU の数を増やすことで克服できます。
実行時エラー より大きい 合計 0 アクティビティ ログまたはリソース ログを調べて、入力、クエリ、出力を適切に変更してください。
基準値の遅延 より大きい 平均 このメトリックの直近 15 分間の平均値が到着遅延許容期間 (秒単位) を超えたとき。 到着遅延許容期間を変更していない場合の既定値は 5 秒に設定されています。 SU 数を増やすか、クエリの並列処理を試してみてください。 SU の詳細については、「ストリーミング ユニットの理解と調整」を参照してください。 クエリの並列処理の詳細については、「Azure Stream Analytics でのクエリの並列処理の活用」を参照してください。
逆シリアル化の入力エラー より大きい 合計 0 アクティビティ ログまたはリソース ログを調べて、入力を適切に変更してください。 リソース ログの詳細については、リソース ログを使用した Azure Stream Analytics のトラブルシューティングに関するページを参照してください。

ヘルプを取得

詳細については、Azure Stream Analytics に関する Microsoft Q&A のページを参照してください。

次のステップ