Compartilhar via


Métricas com suporte para Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

A tabela a seguir lista as métricas disponíveis para o tipo de recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.

Títulos de tabela

Métrica – o nome de exibição da métrica como aparece no portal do Azure.
Nome na API Rest – Nome da métrica, conforme mencionado na API REST.
Unidade – Unidade de medida.
Agregação – o tipo de agregação padrão. Valores válidos: Média, Mínimo, Máximo, Total, Contagem.
Dimensões - Dimensões disponíveis para a métrica.
Granularidades temporais - Intervalos nos quais a métrica é amostrada. Por exemplo, PT1M indica que a métrica é amostrada a cada minuto, PT30M a cada 30 minutos, PT1H a cada hora e assim por diante.
Exportação de DS – se a métrica pode ser exportada para os Logs do Azure Monitor por meio das Configurações de Diagnóstico. Para obter informações sobre como exportar métricas, consulte Criar configurações de diagnóstico no Azure Monitor.

Para obter informações sobre a retenção de métricas, consulte Visão geral das métricas do Azure Monitor.

Categoria Métrica Nome na API REST Unidade Agregação Dimensões Granularidades temporais Exportação de DS
Recurso Percentual de utilização de memória da CPU

Percentual de utilização de memória em uma instância. A utilização é relatada em intervalos de um minuto.
CpuMemoryUtilizationPercentage Porcentagem Mínimo, Máximo, Média instanceId PT1M Yes
Recurso Porcentagem de Utilização de CPU

Percentual de utilização de CPU em uma instância. A utilização é relatada em intervalos de um minuto.
CpuUtilizationPercentage Porcentagem Mínimo, Máximo, Média instanceId PT1M Yes
Recurso Erros de coleta de dados por minuto

O número de eventos de coleta de dados removidos por minuto.
DataCollectionErrorsPerMinute Contagem Mínimo, Máximo, Média instanceId, reason, type PT1M No
Recurso Eventos de coleta de dados por minuto

O número de eventos de coleta de dados processados por minuto.
DataCollectionEventsPerMinute Contagem Mínimo, Máximo, Média instanceId, type PT1M No
Recurso Capacidade de implantação

O número de instâncias na implantação.
DeploymentCapacity Contagem Mínimo, Máximo, Média instanceId, State PT1M No
Recurso Utilização do Disco

Percentual de utilização de disco em uma instância. A utilização é relatada em intervalos de um minuto.
DiskUtilization Porcentagem Mínimo, Máximo, Média instanceId, disk PT1M Yes
Recurso Energia da GPU em Joules

Energia de intervalo em joules em um nó de GPU. A energia é relatada em intervalos de um minuto.
GpuEnergyJoules Contagem Mínimo, Máximo, Média instanceId PT1M No
Recurso Percentual de utilização de memória da GPU

Percentual de utilização de memória da GPU em uma instância. A utilização é relatada em intervalos de um minuto.
GpuMemoryUtilizationPercentage Porcentagem Mínimo, Máximo, Média instanceId PT1M Yes
Recurso Percentual de utilização de GPU

Percentual de utilização da GPU em uma instância. A utilização é relatada em intervalos de um minuto.
GpuUtilizationPercentage Porcentagem Mínimo, Máximo, Média instanceId PT1M Yes
Tráfego Latência da solicitação P50

A latência média de solicitação P50 agregada por todos os valores de latência de solicitação coletados durante o período selecionado
RequestLatency_P50 Milissegundos Média <nenhum> PT1M Yes
Tráfego Latência de solicitação P90

A latência média de solicitação P90 agregada por todos os valores de latência de solicitação coletados durante o período selecionado
RequestLatency_P90 Milissegundos Média <nenhum> PT1M Yes
Tráfego Latência de solicitação P95

A latência média de solicitação P95 agregada por todos os valores de latência de solicitação coletados durante o período selecionado
RequestLatency_P95 Milissegundos Média <nenhum> PT1M Yes
Tráfego Latência de solicitação P99

A latência média de solicitação P99 agregada por todos os valores de latência de solicitação coletados durante o período selecionado
RequestLatency_P99 Milissegundos Média <nenhum> PT1M Yes
Tráfego Solicitações por minuto

O número de solicitações enviadas para a implantação online em um minuto
RequestsPerMinute Contagem Média envoy_response_code PT1M Não