Share via


Métricas suportadas para Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

A tabela seguinte lista as métricas disponíveis para o tipo de recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.

Cabeçalhos de tabela

Métrica – o nome a apresentar da métrica tal como aparece no portal do Azure.
Nome na API Rest - Nome da métrica, como referido na API REST.
Unidade - Unidade de medida.
Agregação – o tipo de agregação predefinido. Valores válidos: Média, Mínimo, Máximo, Total, Contagem.
Dimensões - Dimensões disponíveis para a métrica.
Intervalos de - TempoIntervalos nos quais a métrica é amostrada. Por exemplo, PT1M indica que a métrica é amostrada a cada minuto, PT30M a cada 30 minutos, PT1H a cada hora, etc.
Exportação de DS – se a métrica é exportável para os Registos do Azure Monitor através das Definições de Diagnóstico. Para obter informações sobre a exportação de métricas, veja Criar definições de diagnóstico no Azure Monitor.

Para obter informações sobre a retenção de métricas, veja Descrição geral das Métricas do Azure Monitor.

Categoria Metric Nome na API REST Unidade Agregação Dimensões Intervalos de Tempo Exportação de DS
Recurso Percentagem de Utilização da Memória da CPU

Percentagem de utilização da memória numa instância. A utilização é reportada em intervalos de um minuto.
CpuMemoryUtilizationPercentage Percentagem Mínimo, Máximo, Média instanceId PT1M Yes
Recurso Percentagem de Utilização da CPU

Percentagem de utilização da CPU numa instância. A utilização é reportada em intervalos de um minuto.
CpuUtilizationPercentage Percentagem Mínimo, Máximo, Média instanceId PT1M Yes
Recurso Erros de Recolha de Dados Por Minuto

O número de eventos de recolha de dados diminuiu por minuto.
DataCollectionErrorsPerMinute de palavras Mínimo, Máximo, Média instanceId, reason, type PT1M No
Recurso Eventos de Recolha de Dados Por Minuto

O número de eventos de recolha de dados processados por minuto.
DataCollectionEventsPerMinute de palavras Mínimo, Máximo, Média instanceId, type PT1M No
Recurso Capacidade de Implementação

O número de instâncias na implementação.
DeploymentCapacity de palavras Mínimo, Máximo, Média instanceId, State PT1M No
Recurso Utilização do Disco

Percentagem de utilização do disco numa instância. A utilização é reportada em intervalos de um minuto.
DiskUtilization Percentagem Mínimo, Máximo, Média instanceId, disk PT1M Yes
Recurso GPU Energy em Joules

Energia de intervalo em Joules num nó de GPU. A energia é reportada em intervalos de um minuto.
GpuEnergyJoules de palavras Mínimo, Máximo, Média instanceId PT1M No
Recurso Percentagem de Utilização da Memória da GPU

Percentagem da utilização da memória da GPU numa instância. A utilização é reportada em intervalos de um minuto.
GpuMemoryUtilizationPercentage Percentagem Mínimo, Máximo, Média instanceId PT1M Yes
Recurso Percentagem de Utilização da GPU

Percentagem de utilização da GPU numa instância. A utilização é reportada em intervalos de um minuto.
GpuUtilizationPercentage Percentagem Mínimo, Máximo, Média instanceId PT1M Yes
Trânsito Pedir Latência P50

A latência média do pedido P50 agregada por todos os valores de latência do pedido recolhidos durante o período de tempo selecionado
RequestLatency_P50 Milissegundos Média <nenhum> PT1M Yes
Trânsito Latência do Pedido P90

A latência média dos pedidos P90 agregada por todos os valores de latência do pedido recolhidos durante o período de tempo selecionado
RequestLatency_P90 Milissegundos Média <nenhum> PT1M Yes
Trânsito Latência do Pedido P95

A latência média do pedido P95 agregada por todos os valores de latência do pedido recolhidos durante o período de tempo selecionado
RequestLatency_P95 Milissegundos Média <nenhum> PT1M Yes
Trânsito Latência do Pedido P99

A latência média do pedido P99 agregada por todos os valores de latência do pedido recolhidos durante o período de tempo selecionado
RequestLatency_P99 Milissegundos Média <nenhum> PT1M Yes
Trânsito Pedidos Por Minuto

O número de pedidos enviados para a implementação online num minuto
RequestsPerMinute de palavras Média envoy_response_code PT1M Não