Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments でサポートされているメトリック

次の表に、Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments リソースの種類に使用できるメトリックを示します。

テーブル見出し

メトリック - Azure portalに表示されるメトリックの表示名。
Rest API の名前 - REST API で参照されるメトリック名。
単位 - 測定単位。
集計 - 既定の 集計 の種類。 有効な値: Average、Minimum、Maximum、Total、Count。
寸法 - メトリックで使用できるディメンション
タイム グレイン - メトリックをサンプリングする間隔。 たとえば、 は、 PT1M メトリックが 1 分ごと、30 分ごと、 PT30MPT1H 1 時間ごとなどにサンプリングされることを示します。
DS エクスポート - 診断設定を使用してメトリックを Azure Monitor ログにエクスポートできるかどうか。 メトリックのエクスポートの詳細については、「 Azure Monitor で診断設定を作成する」を参照してください。

メトリックリテンション期間の詳細については、「 Azure Monitor メトリックの概要」を参照してください。

カテゴリ メトリック REST API の名前 ユニット 集計 Dimensions タイム グレイン DS エクスポート
リソース CPU Memory Utilization Percentage (CPU のメモリ使用率)

インスタンスのメモリ使用率 (%)。 使用率は 1 分間隔で報告されます。
CpuMemoryUtilizationPercentage Percent Minimum、Maximum、Average instanceId PT1M Yes
リソース CPU 使用率

インスタンスの CPU 使用率 (%)。 使用率は 1 分間隔で報告されます。
CpuUtilizationPercentage Percent Minimum、Maximum、Average instanceId PT1M Yes
リソース Data Collection Errors Per Minute (1 分あたりのデータ収集エラー数)

1 分あたりに破棄されたデータ収集イベントの数。
DataCollectionErrorsPerMinute Count Minimum、Maximum、Average instanceId, reason, type PT1M いいえ
リソース Data Collection Events Per Minute (1 分あたりのデータ収集イベント数)

1 分あたりに処理されたデータ収集イベントの数。
DataCollectionEventsPerMinute Count Minimum、Maximum、Average instanceId, type PT1M いいえ
リソース デプロイ容量

デプロイ内のインスタンスの数。
DeploymentCapacity Count Minimum、Maximum、Average instanceId, State PT1M いいえ
リソース ディスク使用率

インスタンスのディスク使用率 (%)。 使用率は 1 分間隔で報告されます。
DiskUtilization Percent Minimum、Maximum、Average instanceId, disk PT1M Yes
リソース GPU Energy in Joules (GPU エネルギー (ジュール単位))

GPU ノードでのコンセントのエネルギーの間隔 (ジュール単位)。 エネルギーは 1 分間隔で報告されます。
GpuEnergyJoules Count Minimum、Maximum、Average instanceId PT1M いいえ
リソース GPU Memory Utilization Percentage (GPU のメモリ使用率)

インスタンスの GPU メモリ使用率 (%)。 使用率は 1 分間隔で報告されます。
GpuMemoryUtilizationPercentage Percent Minimum、Maximum、Average instanceId PT1M Yes
リソース GPU 使用率の割合

インスタンスの GPU 使用率 (%)。 使用率は 1 分間隔で報告されます。
GpuUtilizationPercentage Percent Minimum、Maximum、Average instanceId PT1M はい
トラフィック Request Latency P50 (要求の待機時間 P50)

選択した期間に収集されたすべての要求待機時間値によって集計された P50 要求の平均待機時間
RequestLatency_P50 ミリ秒 Average "<なし>" PT1M はい
トラフィック Request Latency P90 (要求の待機時間 P90)

選択した期間に収集されたすべての要求待機時間値によって集計された P90 要求の平均待機時間
RequestLatency_P90 ミリ秒 Average "<なし>" PT1M はい
トラフィック Request Latency P95 (要求の待機時間 P95)

選択した期間に収集されたすべての要求待機時間値によって集計された P95 要求の平均待機時間
RequestLatency_P95 ミリ秒 Average "<なし>" PT1M はい
トラフィック Request Latency P99 (要求の待機時間 P99)

選択した期間に収集されたすべての要求待機時間値によって集計された P99 要求の平均待機時間
RequestLatency_P99 ミリ秒 Average "<なし>" PT1M はい
トラフィック 1 分あたりの要求数

1 分以内にオンライン展開に送信された要求の数
RequestsPerMinute Count Average envoy_response_code PT1M いいえ