分享方式:


Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 的支持計量

下表列出 Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 資源類型的可用計量。

表格標題

計量 - Azure 入口網站 中顯示的計量顯示名稱。
Rest API 中的名稱 - REST API 中所指的計量名稱。
單位 - 量值單位。
匯總 - 預設 匯總 類型。 有效值:Average、Minimum、Maximum、Total、Count。
尺寸 - 計量可用的維度
時間粒度 - 計量取樣的間隔。 例如, PT1M 表示計量會每分鐘取樣一次、每 30 分鐘、 PT30MPT1H 每小時一次等等。
DS 匯出 - 計量是否可以透過診斷設定導出至 Azure 監視器記錄。 如需匯出計量的資訊,請參閱 在 Azure 監視器中建立診斷設定

如需計量保留的相關信息,請參閱 Azure 監視器計量概觀

類別 計量 REST API 中的名稱 單位 彙總 維度 時間粒度 DS 匯出
資源 CPU 記憶體使用率百分比

實例上的記憶體使用率百分比。 使用量會以一分鐘為間隔提供報告。
CpuMemoryUtilizationPercentage 百分比 最小值、最大值、平均數 instanceId PT1M Yes
資源 CPU 使用率百分比

實例上的 CPU 使用率百分比。 使用量會以一分鐘為間隔提供報告。
CpuUtilizationPercentage 百分比 最小值、最大值、平均數 instanceId PT1M Yes
資源 每分鐘數據收集錯誤

每分鐘捨棄的數據收集事件數目。
DataCollectionErrorsPerMinute Count 最小值、最大值、平均數 instanceId, reason, type PT1M No
資源 每分鐘數據收集事件

每分鐘處理的數據收集事件數目。
DataCollectionEventsPerMinute Count 最小值、最大值、平均數 instanceId, type PT1M No
資源 部署容量

部署中的執行個體數目。
DeploymentCapacity Count 最小值、最大值、平均數 instanceId, State PT1M No
資源 磁碟使用率

實例上的磁碟使用率百分比。 使用量會以一分鐘為間隔提供報告。
DiskUtilization 百分比 最小值、最大值、平均數 instanceId, disk PT1M Yes
資源 Joules 中的 GPU 能源

GPU 節點上的間隔能源 (焦耳)。 能源會以一分鐘的間隔提供報告。
GpuEnergyJoules Count 最小值、最大值、平均數 instanceId PT1M No
資源 GPU 記憶體使用率百分比

實例上的 GPU 記憶體使用率百分比。 使用量會以一分鐘為間隔提供報告。
GpuMemoryUtilizationPercentage 百分比 最小值、最大值、平均數 instanceId PT1M Yes
資源 GPU 使用率百分比

實例上的 GPU 使用率百分比。 使用量會以一分鐘為間隔提供報告。
GpuUtilizationPercentage 百分比 最小值、最大值、平均數 instanceId PT1M Yes
交通流量 要求延遲 P50

所有在所選時間週期內收集的要求延遲值匯總的平均 P50 要求延遲
RequestLatency_P50 毫秒 Average 無<> PT1M Yes
交通流量 要求延遲 P90

所有在所選時段內收集的要求延遲值所匯總的平均 P90 要求延遲
RequestLatency_P90 毫秒 Average 無<> PT1M Yes
交通流量 要求延遲 P95

所有在所選時間週期內收集的要求延遲值匯總的平均 P95 要求延遲
RequestLatency_P95 毫秒 Average 無<> PT1M Yes
交通流量 要求延遲 P99

所有在所選時段內收集的要求延遲值匯總的平均 P99 要求延遲
RequestLatency_P99 毫秒 Average 無<> PT1M Yes
交通流量 每分鐘的要求數

在一分鐘內傳送至在線部署的要求數目
RequestsPerMinute Count Average envoy_response_code PT1M