Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments でサポートされているメトリック

2025-04-24

次の表に、Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments リソースの種類で使用できるメトリックを示します。

テーブルの見出し

メトリック - Azure Portal に表示されるメトリックの表示名。
Rest API の名前 - REST API で参照されるメトリック名。
単位 - 測定単位。
集計 - 既定の集計の種類。有効な値: 平均、最小、最大、合計、数。
ディメンション - メトリックで使用できるディメンション。
時間グレイン - メトリックをサンプリングする間隔。たとえば、PT1M は、メトリックを 1 分ごとに、PT30Mは 30 分ごとに、PT1H は 1 時間ごとにサンプリングすることを示します。
DS エクスポート - メトリックが診断設定を介して Azure Monitor ログにエクスポート可能かどうかを示します。

メトリックのエクスポートの詳細については、「データ収集ルールを使用したメトリックのエクスポートおよび Azure Monitor での診断設定の作成を参照してください。

メトリックのリテンション期間の詳細については、「Azure Monitor メトリックの概要」を参照してください。

カテゴリ: リソース

メトリック	REST API での名前	単位	集計	Dimensions	時間グレイン	DS エクスポート
CPU メモリ使用率インスタンスのメモリ使用率 (%)。使用率は 1 分間隔で報告されます。	`CpuMemoryUtilizationPercentage`	パーセント	最小値、最大値、平均値	`instanceId`	PT1M	はい
CPU 使用率インスタンスの CPU 使用率 (%)。使用率は 1 分間隔で報告されます。	`CpuUtilizationPercentage`	パーセント	最小、最大、平均	`instanceId`	PT1M	はい
1 分あたりのデータ収集エラー数分あたりのデータ収集イベントの数が減少しました。	`DataCollectionErrorsPerMinute`	カウント	最小値、最大値、平均	`instanceId`、 `reason`、 `type`	PT1M	いいえ
1 分あたりのデータ収集イベント数 1 分あたりに処理されたデータ収集イベントの数。	`DataCollectionEventsPerMinute`	カウント	最小値、最大値、平均	`instanceId`, `type`	PT1M	いいえ
デプロイ容量デプロイ内のインスタンスの数。	`DeploymentCapacity`	カウント	最低値、最大値、平均値	`instanceId`, `State`	PT1M	いいえ
ディスク使用量インスタンスのディスク使用率 (%)。使用率は 1 分間隔で報告されます。	`DiskUtilization`	パーセント	最小、最大、平均	`instanceId`, `disk`	PT1M	はい
GPU エネルギー (ジュール単位) GPUノードにおけるインターバルでのエネルギー（ジュール単位）。エネルギーは 1 分間隔で報告されます。	`GpuEnergyJoules`	カウント	最小値、最大値、平均	`instanceId`	PT1M	いいえ
GPU メモリ使用率インスタンスの GPU メモリ使用率 (%)。使用率は 1 分間隔で報告されます。	`GpuMemoryUtilizationPercentage`	パーセント	最小、最大、平均	`instanceId`	PT1M	はい
GPU 使用率インスタンスの GPU 使用率 (%)。使用率は 1 分間隔で報告されます。	`GpuUtilizationPercentage`	パーセント	最小、最大、平均	`instanceId`	PT1M	はい

カテゴリ: トラフィック

メトリック	REST API での名前	単位	集計	ディメンション	時間グレイン	DS エクスポート
要求の待機時間 P50 選択した期間に収集されたすべての要求待機時間値によって集計された P50 要求の平均待機時間	`RequestLatency_P50`	ミリ秒	平均	<なし>	PT1M	はい
要求の待機時間 P90 選択した期間に収集されたすべての要求待機時間値によって集計された P90 要求の平均待機時間	`RequestLatency_P90`	ミリ秒	平均	<なし>	PT1M	はい
要求の待機時間 P95 選択した期間に収集されたすべての要求待機時間値によって集計された P95 要求の平均待機時間	`RequestLatency_P95`	ミリ秒	平均	<なし>	PT1M	はい
要求の待機時間 P99 選択した期間に収集されたすべての要求待機時間値によって集計された P99 要求の平均待機時間	`RequestLatency_P99`	ミリ秒	平均	<なし>	PT1M	はい
1 分あたりの要求数 1 分以内にオンラインデプロイに送信された要求の数	`RequestsPerMinute`	カウント	平均	`envoy_response_code`	PT1M	いいえ

次の方法で共有

Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments でサポートされているメトリック

カテゴリ: リソース

カテゴリ: トラフィック

次のステップ

フィードバック

その他のリソース