Métricas suportadas para Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments
A tabela seguinte lista as métricas disponíveis para o tipo de recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.
Cabeçalhos de tabela
Métrica – o nome a apresentar da métrica tal como aparece no portal do Azure.
Nome na API Rest - Nome da métrica, como referido na API REST.
Unidade - Unidade de medida.
Agregação – o tipo de agregação predefinido. Valores válidos: Média, Mínimo, Máximo, Total, Contagem.
Dimensões - Dimensões disponíveis para a métrica.
Intervalos de - TempoIntervalos nos quais a métrica é amostrada. Por exemplo, PT1M
indica que a métrica é amostrada a cada minuto, PT30M
a cada 30 minutos, PT1H
a cada hora, etc.
Exportação de DS – se a métrica é exportável para os Registos do Azure Monitor através das Definições de Diagnóstico. Para obter informações sobre a exportação de métricas, veja Criar definições de diagnóstico no Azure Monitor.
Para obter informações sobre a retenção de métricas, veja Descrição geral das Métricas do Azure Monitor.
Categoria | Metric | Nome na API REST | Unidade | Agregação | Dimensões | Intervalos de Tempo | Exportação de DS |
---|---|---|---|---|---|---|---|
Recurso | Percentagem de Utilização da Memória da CPU Percentagem de utilização da memória numa instância. A utilização é reportada em intervalos de um minuto. |
CpuMemoryUtilizationPercentage |
Percentagem | Mínimo, Máximo, Média | instanceId |
PT1M | Yes |
Recurso | Percentagem de Utilização da CPU Percentagem de utilização da CPU numa instância. A utilização é reportada em intervalos de um minuto. |
CpuUtilizationPercentage |
Percentagem | Mínimo, Máximo, Média | instanceId |
PT1M | Yes |
Recurso | Erros de Recolha de Dados Por Minuto O número de eventos de recolha de dados diminuiu por minuto. |
DataCollectionErrorsPerMinute |
de palavras | Mínimo, Máximo, Média | instanceId , reason , type |
PT1M | No |
Recurso | Eventos de Recolha de Dados Por Minuto O número de eventos de recolha de dados processados por minuto. |
DataCollectionEventsPerMinute |
de palavras | Mínimo, Máximo, Média | instanceId , type |
PT1M | No |
Recurso | Capacidade de Implementação O número de instâncias na implementação. |
DeploymentCapacity |
de palavras | Mínimo, Máximo, Média | instanceId , State |
PT1M | No |
Recurso | Utilização do Disco Percentagem de utilização do disco numa instância. A utilização é reportada em intervalos de um minuto. |
DiskUtilization |
Percentagem | Mínimo, Máximo, Média | instanceId , disk |
PT1M | Yes |
Recurso | GPU Energy em Joules Energia de intervalo em Joules num nó de GPU. A energia é reportada em intervalos de um minuto. |
GpuEnergyJoules |
de palavras | Mínimo, Máximo, Média | instanceId |
PT1M | No |
Recurso | Percentagem de Utilização da Memória da GPU Percentagem da utilização da memória da GPU numa instância. A utilização é reportada em intervalos de um minuto. |
GpuMemoryUtilizationPercentage |
Percentagem | Mínimo, Máximo, Média | instanceId |
PT1M | Yes |
Recurso | Percentagem de Utilização da GPU Percentagem de utilização da GPU numa instância. A utilização é reportada em intervalos de um minuto. |
GpuUtilizationPercentage |
Percentagem | Mínimo, Máximo, Média | instanceId |
PT1M | Yes |
Trânsito | Pedir Latência P50 A latência média do pedido P50 agregada por todos os valores de latência do pedido recolhidos durante o período de tempo selecionado |
RequestLatency_P50 |
Milissegundos | Média | <nenhum> | PT1M | Yes |
Trânsito | Latência do Pedido P90 A latência média dos pedidos P90 agregada por todos os valores de latência do pedido recolhidos durante o período de tempo selecionado |
RequestLatency_P90 |
Milissegundos | Média | <nenhum> | PT1M | Yes |
Trânsito | Latência do Pedido P95 A latência média do pedido P95 agregada por todos os valores de latência do pedido recolhidos durante o período de tempo selecionado |
RequestLatency_P95 |
Milissegundos | Média | <nenhum> | PT1M | Yes |
Trânsito | Latência do Pedido P99 A latência média do pedido P99 agregada por todos os valores de latência do pedido recolhidos durante o período de tempo selecionado |
RequestLatency_P99 |
Milissegundos | Média | <nenhum> | PT1M | Yes |
Trânsito | Pedidos Por Minuto O número de pedidos enviados para a implementação online num minuto |
RequestsPerMinute |
de palavras | Média | envoy_response_code |
PT1M | Não |
Comentários
https://aka.ms/ContentUserFeedback.
Brevemente: Ao longo de 2024, vamos descontinuar progressivamente o GitHub Issues como mecanismo de feedback para conteúdos e substituí-lo por um novo sistema de feedback. Para obter mais informações, veja:Submeter e ver comentários