Métricas com suporte para Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Artigo
03/26/2024

A tabela a seguir lista as métricas disponíveis para o tipo de recurso Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.

Títulos de tabela

Métrica – o nome de exibição da métrica como aparece no portal do Azure.
Nome na API Rest – Nome da métrica, conforme mencionado na API REST.
Unidade – Unidade de medida.
Agregação – o tipo de agregação padrão. Valores válidos: Média, Mínimo, Máximo, Total, Contagem.
Dimensões - Dimensões disponíveis para a métrica.
Granularidades temporais - Intervalos nos quais a métrica é amostrada. Por exemplo, PT1M indica que a métrica é amostrada a cada minuto, PT30M a cada 30 minutos, PT1H a cada hora e assim por diante.
Exportação de DS – se a métrica pode ser exportada para os Logs do Azure Monitor por meio das Configurações de Diagnóstico. Para obter informações sobre como exportar métricas, consulte Criar configurações de diagnóstico no Azure Monitor.

Para obter informações sobre a retenção de métricas, consulte Visão geral das métricas do Azure Monitor.

Categoria	Métrica	Nome na API REST	Unidade	Agregação	Dimensões	Granularidades temporais	Exportação de DS
Recurso	Percentual de utilização de memória da CPU Percentual de utilização de memória em uma instância. A utilização é relatada em intervalos de um minuto.	`CpuMemoryUtilizationPercentage`	Porcentagem	Mínimo, Máximo, Média	`instanceId`	PT1M	Yes
Recurso	Porcentagem de Utilização de CPU Percentual de utilização de CPU em uma instância. A utilização é relatada em intervalos de um minuto.	`CpuUtilizationPercentage`	Porcentagem	Mínimo, Máximo, Média	`instanceId`	PT1M	Yes
Recurso	Erros de coleta de dados por minuto O número de eventos de coleta de dados removidos por minuto.	`DataCollectionErrorsPerMinute`	Contagem	Mínimo, Máximo, Média	`instanceId`, `reason`, `type`	PT1M	No
Recurso	Eventos de coleta de dados por minuto O número de eventos de coleta de dados processados por minuto.	`DataCollectionEventsPerMinute`	Contagem	Mínimo, Máximo, Média	`instanceId`, `type`	PT1M	No
Recurso	Capacidade de implantação O número de instâncias na implantação.	`DeploymentCapacity`	Contagem	Mínimo, Máximo, Média	`instanceId`, `State`	PT1M	No
Recurso	Utilização do Disco Percentual de utilização de disco em uma instância. A utilização é relatada em intervalos de um minuto.	`DiskUtilization`	Porcentagem	Mínimo, Máximo, Média	`instanceId`, `disk`	PT1M	Yes
Recurso	Energia da GPU em Joules Energia de intervalo em joules em um nó de GPU. A energia é relatada em intervalos de um minuto.	`GpuEnergyJoules`	Contagem	Mínimo, Máximo, Média	`instanceId`	PT1M	No
Recurso	Percentual de utilização de memória da GPU Percentual de utilização de memória da GPU em uma instância. A utilização é relatada em intervalos de um minuto.	`GpuMemoryUtilizationPercentage`	Porcentagem	Mínimo, Máximo, Média	`instanceId`	PT1M	Yes
Recurso	Percentual de utilização de GPU Percentual de utilização da GPU em uma instância. A utilização é relatada em intervalos de um minuto.	`GpuUtilizationPercentage`	Porcentagem	Mínimo, Máximo, Média	`instanceId`	PT1M	Yes
Tráfego	Latência da solicitação P50 A latência média de solicitação P50 agregada por todos os valores de latência de solicitação coletados durante o período selecionado	`RequestLatency_P50`	Milissegundos	Média	<nenhum>	PT1M	Yes
Tráfego	Latência de solicitação P90 A latência média de solicitação P90 agregada por todos os valores de latência de solicitação coletados durante o período selecionado	`RequestLatency_P90`	Milissegundos	Média	<nenhum>	PT1M	Yes
Tráfego	Latência de solicitação P95 A latência média de solicitação P95 agregada por todos os valores de latência de solicitação coletados durante o período selecionado	`RequestLatency_P95`	Milissegundos	Média	<nenhum>	PT1M	Yes
Tráfego	Latência de solicitação P99 A latência média de solicitação P99 agregada por todos os valores de latência de solicitação coletados durante o período selecionado	`RequestLatency_P99`	Milissegundos	Média	<nenhum>	PT1M	Yes
Tráfego	Solicitações por minuto O número de solicitações enviadas para a implantação online em um minuto	`RequestsPerMinute`	Contagem	Média	`envoy_response_code`	PT1M	Não

Compartilhar via

Métricas com suporte para Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

Comentários

Comentários

Recursos adicionais