Métricas com suporte para Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
A tabela a seguir lista as métricas disponíveis para o tipo de recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.
Títulos de tabela
Métrica – o nome de exibição da métrica como aparece no portal do Azure.
Nome na API Rest – Nome da métrica, conforme mencionado na API REST.
Unidade – Unidade de medida.
Agregação – o tipo de agregação padrão. Valores válidos: Média, Mínimo, Máximo, Total, Contagem.
Dimensões - Dimensões disponíveis para a métrica.
Granularidades temporais - Intervalos nos quais a métrica é amostrada. Por exemplo, PT1M
indica que a métrica é amostrada a cada minuto, PT30M
a cada 30 minutos, PT1H
a cada hora e assim por diante.
Exportação de DS – se a métrica pode ser exportada para os Logs do Azure Monitor por meio das Configurações de Diagnóstico. Para obter informações sobre como exportar métricas, consulte Criar configurações de diagnóstico no Azure Monitor.
Para obter informações sobre a retenção de métricas, consulte Visão geral das métricas do Azure Monitor.
Categoria | Métrica | Nome na API REST | Unidade | Agregação | Dimensões | Granularidades temporais | Exportação de DS |
---|---|---|---|---|---|---|---|
Recurso | Percentual de utilização de memória da CPU Percentual de utilização de memória em uma instância. A utilização é relatada em intervalos de um minuto. |
CpuMemoryUtilizationPercentage |
Porcentagem | Mínimo, Máximo, Média | instanceId |
PT1M | Yes |
Recurso | Porcentagem de Utilização de CPU Percentual de utilização de CPU em uma instância. A utilização é relatada em intervalos de um minuto. |
CpuUtilizationPercentage |
Porcentagem | Mínimo, Máximo, Média | instanceId |
PT1M | Yes |
Recurso | Erros de coleta de dados por minuto O número de eventos de coleta de dados removidos por minuto. |
DataCollectionErrorsPerMinute |
Contagem | Mínimo, Máximo, Média | instanceId , reason , type |
PT1M | No |
Recurso | Eventos de coleta de dados por minuto O número de eventos de coleta de dados processados por minuto. |
DataCollectionEventsPerMinute |
Contagem | Mínimo, Máximo, Média | instanceId , type |
PT1M | No |
Recurso | Capacidade de implantação O número de instâncias na implantação. |
DeploymentCapacity |
Contagem | Mínimo, Máximo, Média | instanceId , State |
PT1M | No |
Recurso | Utilização do Disco Percentual de utilização de disco em uma instância. A utilização é relatada em intervalos de um minuto. |
DiskUtilization |
Porcentagem | Mínimo, Máximo, Média | instanceId , disk |
PT1M | Yes |
Recurso | Energia da GPU em Joules Energia de intervalo em joules em um nó de GPU. A energia é relatada em intervalos de um minuto. |
GpuEnergyJoules |
Contagem | Mínimo, Máximo, Média | instanceId |
PT1M | No |
Recurso | Percentual de utilização de memória da GPU Percentual de utilização de memória da GPU em uma instância. A utilização é relatada em intervalos de um minuto. |
GpuMemoryUtilizationPercentage |
Porcentagem | Mínimo, Máximo, Média | instanceId |
PT1M | Yes |
Recurso | Percentual de utilização de GPU Percentual de utilização da GPU em uma instância. A utilização é relatada em intervalos de um minuto. |
GpuUtilizationPercentage |
Porcentagem | Mínimo, Máximo, Média | instanceId |
PT1M | Yes |
Tráfego | Latência da solicitação P50 A latência média de solicitação P50 agregada por todos os valores de latência de solicitação coletados durante o período selecionado |
RequestLatency_P50 |
Milissegundos | Média | <nenhum> | PT1M | Yes |
Tráfego | Latência de solicitação P90 A latência média de solicitação P90 agregada por todos os valores de latência de solicitação coletados durante o período selecionado |
RequestLatency_P90 |
Milissegundos | Média | <nenhum> | PT1M | Yes |
Tráfego | Latência de solicitação P95 A latência média de solicitação P95 agregada por todos os valores de latência de solicitação coletados durante o período selecionado |
RequestLatency_P95 |
Milissegundos | Média | <nenhum> | PT1M | Yes |
Tráfego | Latência de solicitação P99 A latência média de solicitação P99 agregada por todos os valores de latência de solicitação coletados durante o período selecionado |
RequestLatency_P99 |
Milissegundos | Média | <nenhum> | PT1M | Yes |
Tráfego | Solicitações por minuto O número de solicitações enviadas para a implantação online em um minuto |
RequestsPerMinute |
Contagem | Média | envoy_response_code |
PT1M | Não |
Comentários
https://aka.ms/ContentUserFeedback.
Em breve: Ao longo de 2024, eliminaremos os problemas do GitHub como o mecanismo de comentários para conteúdo e o substituiremos por um novo sistema de comentários. Para obter mais informações, consulteEnviar e exibir comentários de