Métricas suportadas para Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Artigo
03/26/2024

A tabela seguinte lista as métricas disponíveis para o tipo de recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.

Cabeçalhos de tabela

Métrica – o nome a apresentar da métrica tal como aparece no portal do Azure.
Nome na API Rest - Nome da métrica, como referido na API REST.
Unidade - Unidade de medida.
Agregação – o tipo de agregação predefinido. Valores válidos: Média, Mínimo, Máximo, Total, Contagem.
Dimensões - Dimensões disponíveis para a métrica.
Intervalos de - TempoIntervalos nos quais a métrica é amostrada. Por exemplo, PT1M indica que a métrica é amostrada a cada minuto, PT30M a cada 30 minutos, PT1H a cada hora, etc.
Exportação de DS – se a métrica é exportável para os Registos do Azure Monitor através das Definições de Diagnóstico. Para obter informações sobre a exportação de métricas, veja Criar definições de diagnóstico no Azure Monitor.

Para obter informações sobre a retenção de métricas, veja Descrição geral das Métricas do Azure Monitor.

Categoria	Metric	Nome na API REST	Unidade	Agregação	Dimensões	Intervalos de Tempo	Exportação de DS
Recurso	Percentagem de Utilização da Memória da CPU Percentagem de utilização da memória numa instância. A utilização é reportada em intervalos de um minuto.	`CpuMemoryUtilizationPercentage`	Percentagem	Mínimo, Máximo, Média	`instanceId`	PT1M	Yes
Recurso	Percentagem de Utilização da CPU Percentagem de utilização da CPU numa instância. A utilização é reportada em intervalos de um minuto.	`CpuUtilizationPercentage`	Percentagem	Mínimo, Máximo, Média	`instanceId`	PT1M	Yes
Recurso	Erros de Recolha de Dados Por Minuto O número de eventos de recolha de dados diminuiu por minuto.	`DataCollectionErrorsPerMinute`	de palavras	Mínimo, Máximo, Média	`instanceId`, `reason`, `type`	PT1M	No
Recurso	Eventos de Recolha de Dados Por Minuto O número de eventos de recolha de dados processados por minuto.	`DataCollectionEventsPerMinute`	de palavras	Mínimo, Máximo, Média	`instanceId`, `type`	PT1M	No
Recurso	Capacidade de Implementação O número de instâncias na implementação.	`DeploymentCapacity`	de palavras	Mínimo, Máximo, Média	`instanceId`, `State`	PT1M	No
Recurso	Utilização do Disco Percentagem de utilização do disco numa instância. A utilização é reportada em intervalos de um minuto.	`DiskUtilization`	Percentagem	Mínimo, Máximo, Média	`instanceId`, `disk`	PT1M	Yes
Recurso	GPU Energy em Joules Energia de intervalo em Joules num nó de GPU. A energia é reportada em intervalos de um minuto.	`GpuEnergyJoules`	de palavras	Mínimo, Máximo, Média	`instanceId`	PT1M	No
Recurso	Percentagem de Utilização da Memória da GPU Percentagem da utilização da memória da GPU numa instância. A utilização é reportada em intervalos de um minuto.	`GpuMemoryUtilizationPercentage`	Percentagem	Mínimo, Máximo, Média	`instanceId`	PT1M	Yes
Recurso	Percentagem de Utilização da GPU Percentagem de utilização da GPU numa instância. A utilização é reportada em intervalos de um minuto.	`GpuUtilizationPercentage`	Percentagem	Mínimo, Máximo, Média	`instanceId`	PT1M	Yes
Trânsito	Pedir Latência P50 A latência média do pedido P50 agregada por todos os valores de latência do pedido recolhidos durante o período de tempo selecionado	`RequestLatency_P50`	Milissegundos	Média	<nenhum>	PT1M	Yes
Trânsito	Latência do Pedido P90 A latência média dos pedidos P90 agregada por todos os valores de latência do pedido recolhidos durante o período de tempo selecionado	`RequestLatency_P90`	Milissegundos	Média	<nenhum>	PT1M	Yes
Trânsito	Latência do Pedido P95 A latência média do pedido P95 agregada por todos os valores de latência do pedido recolhidos durante o período de tempo selecionado	`RequestLatency_P95`	Milissegundos	Média	<nenhum>	PT1M	Yes
Trânsito	Latência do Pedido P99 A latência média do pedido P99 agregada por todos os valores de latência do pedido recolhidos durante o período de tempo selecionado	`RequestLatency_P99`	Milissegundos	Média	<nenhum>	PT1M	Yes
Trânsito	Pedidos Por Minuto O número de pedidos enviados para a implementação online num minuto	`RequestsPerMinute`	de palavras	Média	`envoy_response_code`	PT1M	Não

Partilhar via

Métricas suportadas para Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Comentários

Comentários

Recursos adicionais