Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 的支持計量
下表列出 Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments 資源類型的可用計量。
表格標題
計量 - Azure 入口網站 中顯示的計量顯示名稱。
Rest API 中的名稱 - REST API 中所指的計量名稱。
單位 - 量值單位。
匯總 - 預設 匯總 類型。 有效值:Average、Minimum、Maximum、Total、Count。
尺寸 - 計量可用的維度。
時間粒度 - 計量取樣的間隔。 例如, PT1M
表示計量會每分鐘取樣一次、每 30 分鐘、 PT30M
PT1H
每小時一次等等。
DS 匯出 - 計量是否可以透過診斷設定導出至 Azure 監視器記錄。 如需匯出計量的資訊,請參閱 在 Azure 監視器中建立診斷設定。
如需計量保留的相關信息,請參閱 Azure 監視器計量概觀。
類別 | 計量 | REST API 中的名稱 | 單位 | 彙總 | 維度 | 時間粒度 | DS 匯出 |
---|---|---|---|---|---|---|---|
資源 | CPU 記憶體使用率百分比 實例上的記憶體使用率百分比。 使用量會以一分鐘為間隔提供報告。 |
CpuMemoryUtilizationPercentage |
百分比 | 最小值、最大值、平均數 | instanceId |
PT1M | Yes |
資源 | CPU 使用率百分比 實例上的 CPU 使用率百分比。 使用量會以一分鐘為間隔提供報告。 |
CpuUtilizationPercentage |
百分比 | 最小值、最大值、平均數 | instanceId |
PT1M | Yes |
資源 | 每分鐘數據收集錯誤 每分鐘捨棄的數據收集事件數目。 |
DataCollectionErrorsPerMinute |
Count | 最小值、最大值、平均數 | instanceId , reason , type |
PT1M | No |
資源 | 每分鐘數據收集事件 每分鐘處理的數據收集事件數目。 |
DataCollectionEventsPerMinute |
Count | 最小值、最大值、平均數 | instanceId , type |
PT1M | No |
資源 | 部署容量 部署中的執行個體數目。 |
DeploymentCapacity |
Count | 最小值、最大值、平均數 | instanceId , State |
PT1M | No |
資源 | 磁碟使用率 實例上的磁碟使用率百分比。 使用量會以一分鐘為間隔提供報告。 |
DiskUtilization |
百分比 | 最小值、最大值、平均數 | instanceId , disk |
PT1M | Yes |
資源 | Joules 中的 GPU 能源 GPU 節點上的間隔能源 (焦耳)。 能源會以一分鐘的間隔提供報告。 |
GpuEnergyJoules |
Count | 最小值、最大值、平均數 | instanceId |
PT1M | No |
資源 | GPU 記憶體使用率百分比 實例上的 GPU 記憶體使用率百分比。 使用量會以一分鐘為間隔提供報告。 |
GpuMemoryUtilizationPercentage |
百分比 | 最小值、最大值、平均數 | instanceId |
PT1M | Yes |
資源 | GPU 使用率百分比 實例上的 GPU 使用率百分比。 使用量會以一分鐘為間隔提供報告。 |
GpuUtilizationPercentage |
百分比 | 最小值、最大值、平均數 | instanceId |
PT1M | Yes |
交通流量 | 要求延遲 P50 所有在所選時間週期內收集的要求延遲值匯總的平均 P50 要求延遲 |
RequestLatency_P50 |
毫秒 | Average | 無<> | PT1M | Yes |
交通流量 | 要求延遲 P90 所有在所選時段內收集的要求延遲值所匯總的平均 P90 要求延遲 |
RequestLatency_P90 |
毫秒 | Average | 無<> | PT1M | Yes |
交通流量 | 要求延遲 P95 所有在所選時間週期內收集的要求延遲值匯總的平均 P95 要求延遲 |
RequestLatency_P95 |
毫秒 | Average | 無<> | PT1M | Yes |
交通流量 | 要求延遲 P99 所有在所選時段內收集的要求延遲值匯總的平均 P99 要求延遲 |
RequestLatency_P99 |
毫秒 | Average | 無<> | PT1M | Yes |
交通流量 | 每分鐘的要求數 在一分鐘內傳送至在線部署的要求數目 |
RequestsPerMinute |
Count | Average | envoy_response_code |
PT1M | 否 |
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應