Métricas admitidas para Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

En la tabla siguiente se enumeran las métricas disponibles para el tipo de recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.

Encabezados de tabla

Métrica: el nombre para mostrar de la métrica tal y como aparece en el Azure Portal.
Nombre de la API rest : nombre de métrica como se conoce en la API REST.
Unidad : unidad de medida.
Aggregation : el tipo de agregación predeterminado. Valores válidos: Average, Minimum, Maximum, Total, Count.
Dimensiones - Dimensiones disponibles para la métrica.
Granos - de tiempoIntervalos en los que se muestrea la métrica. Por ejemplo, PT1M indica que la métrica se muestrea cada minuto, PT30M cada 30 minutos, PT1H cada hora, etc.
Exportación de DS: indica si la métrica se puede exportar a los registros de Azure Monitor mediante la configuración de diagnóstico. Para más información sobre cómo exportar métricas, consulte Creación de una configuración de diagnóstico en Azure Monitor.

Para más información sobre la retención de métricas, consulte Introducción a las métricas de Azure Monitor.

Category Métrica Nombre en la API REST Unidad Agregación Dimensions Granos de tiempo Exportación de DS
Recurso CPU Memory Utilization Percentage

Porcentaje de uso de memoria en una instancia. El uso se notifica en intervalos de un minuto.
CpuMemoryUtilizationPercentage Percent Mínimo, Máximo, Promedio instanceId PT1M
Recurso Porcentaje de uso de la CPU

Porcentaje de uso de CPU en una instancia. El uso se notifica en intervalos de un minuto.
CpuUtilizationPercentage Percent Mínimo, Máximo, Promedio instanceId PT1M
Recurso Data Collection Errors Per Minute

Número de eventos de recopilación de datos eliminados por minuto.
DataCollectionErrorsPerMinute Count Mínimo, Máximo, Promedio instanceId, reason, type PT1M No
Recurso Data Collection Events Per Minute

Número de eventos de recopilación de datos procesados por minuto.
DataCollectionEventsPerMinute Count Mínimo, Máximo, Promedio instanceId, type PT1M No
Recurso Deployment Capacity

Número de instancias de la implementación.
DeploymentCapacity Count Mínimo, Máximo, Promedio instanceId, State PT1M No
Recurso Utilización de disco

Porcentaje de uso de disco en una instancia. El uso se notifica en intervalos de un minuto.
DiskUtilization Percent Mínimo, Máximo, Promedio instanceId, disk PT1M
Recurso GPU Energy in Joules

Energía en intervalos en Joules en un nodo de GPU. La energía se notifica en intervalos de un minuto.
GpuEnergyJoules Count Mínimo, Máximo, Promedio instanceId PT1M No
Recurso GPU Memory Utilization Percentage

Porcentaje de uso de memoria de GPU en una instancia. El uso se notifica en intervalos de un minuto.
GpuMemoryUtilizationPercentage Percent Mínimo, Máximo, Promedio instanceId PT1M
Recurso Porcentaje de uso de GPU

Porcentaje de uso de GPU en una instancia. El uso se notifica en intervalos de un minuto.
GpuUtilizationPercentage Percent Mínimo, Máximo, Promedio instanceId PT1M
Tráfico Request Latency P50

Latencia media de las solicitudes P50, a partir de todos los valores de latencia de las solicitudes recopilados durante el período de tiempo seleccionado
RequestLatency_P50 Milisegundos Average <Ninguna> PT1M
Tráfico Request Latency P90

Latencia media de las solicitudes P90, a partir de todos los valores de latencia de las solicitudes recopilados durante el período de tiempo seleccionado
RequestLatency_P90 Milisegundos Average <Ninguna> PT1M
Tráfico Request Latency P95

Latencia media de las solicitudes P95, a partir de todos los valores de latencia de las solicitudes recopilados durante el período de tiempo seleccionado
RequestLatency_P95 Milisegundos Average <Ninguna> PT1M
Tráfico Request Latency P99

Latencia media de las solicitudes P99, a partir de todos los valores de latencia de las solicitudes recopilados durante el período de tiempo seleccionado
RequestLatency_P99 Milisegundos Average <Ninguna> PT1M
Tráfico Solicitudes por minuto

Número de solicitudes enviadas a la implementación en línea en un minuto
RequestsPerMinute Count Average envoy_response_code PT1M No