Métricas admitidas para Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
En la tabla siguiente se enumeran las métricas disponibles para el tipo de recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.
Encabezados de tabla
Métrica: el nombre para mostrar de la métrica tal y como aparece en el Azure Portal.
Nombre de la API rest : nombre de métrica como se conoce en la API REST.
Unidad : unidad de medida.
Aggregation : el tipo de agregación predeterminado. Valores válidos: Average, Minimum, Maximum, Total, Count.
Dimensiones - Dimensiones disponibles para la métrica.
Granos - de tiempoIntervalos en los que se muestrea la métrica. Por ejemplo, PT1M
indica que la métrica se muestrea cada minuto, PT30M
cada 30 minutos, PT1H
cada hora, etc.
Exportación de DS: indica si la métrica se puede exportar a los registros de Azure Monitor mediante la configuración de diagnóstico. Para más información sobre cómo exportar métricas, consulte Creación de una configuración de diagnóstico en Azure Monitor.
Para más información sobre la retención de métricas, consulte Introducción a las métricas de Azure Monitor.
Category | Métrica | Nombre en la API REST | Unidad | Agregación | Dimensions | Granos de tiempo | Exportación de DS |
---|---|---|---|---|---|---|---|
Recurso | CPU Memory Utilization Percentage Porcentaje de uso de memoria en una instancia. El uso se notifica en intervalos de un minuto. |
CpuMemoryUtilizationPercentage |
Percent | Mínimo, Máximo, Promedio | instanceId |
PT1M | Sí |
Recurso | Porcentaje de uso de la CPU Porcentaje de uso de CPU en una instancia. El uso se notifica en intervalos de un minuto. |
CpuUtilizationPercentage |
Percent | Mínimo, Máximo, Promedio | instanceId |
PT1M | Sí |
Recurso | Data Collection Errors Per Minute Número de eventos de recopilación de datos eliminados por minuto. |
DataCollectionErrorsPerMinute |
Count | Mínimo, Máximo, Promedio | instanceId , reason , type |
PT1M | No |
Recurso | Data Collection Events Per Minute Número de eventos de recopilación de datos procesados por minuto. |
DataCollectionEventsPerMinute |
Count | Mínimo, Máximo, Promedio | instanceId , type |
PT1M | No |
Recurso | Deployment Capacity Número de instancias de la implementación. |
DeploymentCapacity |
Count | Mínimo, Máximo, Promedio | instanceId , State |
PT1M | No |
Recurso | Utilización de disco Porcentaje de uso de disco en una instancia. El uso se notifica en intervalos de un minuto. |
DiskUtilization |
Percent | Mínimo, Máximo, Promedio | instanceId , disk |
PT1M | Sí |
Recurso | GPU Energy in Joules Energía en intervalos en Joules en un nodo de GPU. La energía se notifica en intervalos de un minuto. |
GpuEnergyJoules |
Count | Mínimo, Máximo, Promedio | instanceId |
PT1M | No |
Recurso | GPU Memory Utilization Percentage Porcentaje de uso de memoria de GPU en una instancia. El uso se notifica en intervalos de un minuto. |
GpuMemoryUtilizationPercentage |
Percent | Mínimo, Máximo, Promedio | instanceId |
PT1M | Sí |
Recurso | Porcentaje de uso de GPU Porcentaje de uso de GPU en una instancia. El uso se notifica en intervalos de un minuto. |
GpuUtilizationPercentage |
Percent | Mínimo, Máximo, Promedio | instanceId |
PT1M | Sí |
Tráfico | Request Latency P50 Latencia media de las solicitudes P50, a partir de todos los valores de latencia de las solicitudes recopilados durante el período de tiempo seleccionado |
RequestLatency_P50 |
Milisegundos | Average | <Ninguna> | PT1M | Sí |
Tráfico | Request Latency P90 Latencia media de las solicitudes P90, a partir de todos los valores de latencia de las solicitudes recopilados durante el período de tiempo seleccionado |
RequestLatency_P90 |
Milisegundos | Average | <Ninguna> | PT1M | Sí |
Tráfico | Request Latency P95 Latencia media de las solicitudes P95, a partir de todos los valores de latencia de las solicitudes recopilados durante el período de tiempo seleccionado |
RequestLatency_P95 |
Milisegundos | Average | <Ninguna> | PT1M | Sí |
Tráfico | Request Latency P99 Latencia media de las solicitudes P99, a partir de todos los valores de latencia de las solicitudes recopilados durante el período de tiempo seleccionado |
RequestLatency_P99 |
Milisegundos | Average | <Ninguna> | PT1M | Sí |
Tráfico | Solicitudes por minuto Número de solicitudes enviadas a la implementación en línea en un minuto |
RequestsPerMinute |
Count | Average | envoy_response_code |
PT1M | No |
Comentarios
https://aka.ms/ContentUserFeedback.
Próximamente: A lo largo de 2024 iremos eliminando gradualmente GitHub Issues como mecanismo de comentarios sobre el contenido y lo sustituiremos por un nuevo sistema de comentarios. Para más información, vea:Enviar y ver comentarios de