次の方法で共有


Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments でサポートされているメトリック

次の表に、Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments リソースの種類で使用できるメトリックを示します。

テーブルの見出し

メトリック - Azure Portal に表示されるメトリックの表示名。
Rest API の名前 - REST API で参照されるメトリック名
単位 - 測定単位。
集計 - 既定の集計の種類。 有効な値: 平均、最小、最大、合計、数。
ディメンション - メトリックで使用できるディメンション
時間グレイン - メトリックをサンプリングする間隔。 たとえば、PT1M は、メトリックを 1 分ごとに、PT30Mは 30 分ごとに、PT1H は 1 時間ごとにサンプリングすることを示します。
DS エクスポート - メトリックが診断設定を介して Azure Monitor ログにエクスポート可能かどうかを示します。

メトリックのエクスポートの詳細については、「データ収集ルールを使用したメトリックのエクスポートおよび Azure Monitor での診断設定の作成を参照してください。

メトリックのリテンション期間の詳細については、「Azure Monitor メトリックの概要」を参照してください。

カテゴリ: リソース

メトリック REST API での名前 単位 集計 Dimensions 時間グレイン DS エクスポート
CPU メモリ使用率

インスタンスのメモリ使用率 (%)。 使用率は 1 分間隔で報告されます。
CpuMemoryUtilizationPercentage パーセント 最小値、最大値、平均値 instanceId PT1M はい
CPU 使用率

インスタンスの CPU 使用率 (%)。 使用率は 1 分間隔で報告されます。
CpuUtilizationPercentage パーセント 最小、最大、平均 instanceId PT1M はい
1 分あたりのデータ収集エラー数

分あたりのデータ収集イベントの数が減少しました。
DataCollectionErrorsPerMinute カウント 最小値、最大値、平均 instanceIdreasontype PT1M いいえ
1 分あたりのデータ収集イベント数

1 分あたりに処理されたデータ収集イベントの数。
DataCollectionEventsPerMinute カウント 最小値、最大値、平均 instanceId, type PT1M いいえ
デプロイ容量

デプロイ内のインスタンスの数。
DeploymentCapacity カウント 最低値、最大値、平均値 instanceId, State PT1M いいえ
ディスク使用量

インスタンスのディスク使用率 (%)。 使用率は 1 分間隔で報告されます。
DiskUtilization パーセント 最小、最大、平均 instanceId, disk PT1M はい
GPU エネルギー (ジュール単位)

GPUノードにおけるインターバルでのエネルギー(ジュール単位)。 エネルギーは 1 分間隔で報告されます。
GpuEnergyJoules カウント 最小値、最大値、平均 instanceId PT1M いいえ
GPU メモリ使用率

インスタンスの GPU メモリ使用率 (%)。 使用率は 1 分間隔で報告されます。
GpuMemoryUtilizationPercentage パーセント 最小、最大、平均 instanceId PT1M はい
GPU 使用率

インスタンスの GPU 使用率 (%)。 使用率は 1 分間隔で報告されます。
GpuUtilizationPercentage パーセント 最小、最大、平均 instanceId PT1M はい

カテゴリ: トラフィック

メトリック REST API での名前 単位 集計 ディメンション 時間グレイン DS エクスポート
要求の待機時間 P50

選択した期間に収集されたすべての要求待機時間値によって集計された P50 要求の平均待機時間
RequestLatency_P50 ミリ秒 平均 <なし> PT1M はい
要求の待機時間 P90

選択した期間に収集されたすべての要求待機時間値によって集計された P90 要求の平均待機時間
RequestLatency_P90 ミリ秒 平均 <なし> PT1M はい
要求の待機時間 P95

選択した期間に収集されたすべての要求待機時間値によって集計された P95 要求の平均待機時間
RequestLatency_P95 ミリ秒 平均 <なし> PT1M はい
要求の待機時間 P99

選択した期間に収集されたすべての要求待機時間値によって集計された P99 要求の平均待機時間
RequestLatency_P99 ミリ秒 平均 <なし> PT1M はい
1 分あたりの要求数

1 分以内にオンライン デプロイに送信された要求の数
RequestsPerMinute カウント 平均 envoy_response_code PT1M いいえ

次のステップ