Monitorar a ingestão de métricas no workspace do Azure Monitor (versão prévia)

Erros de ingestão são problemas que ocorreram durante a ingestão de dados. As condições de erro dessa categoria podem sugerir perda de dados e, portanto, é importante monitorá-las. Esses erros podem incluir indicações de que os limites de ingestão do workspace do Azure Monitor foram atingidos. Para obter limites de serviço para workspaces do Azure Monitor, consulte os limites de serviço do Azure Monitor.

Importante

Esse recurso está atualmente em versão prévia e pode estar sujeito a alterações. O suporte para esse recurso é limitado. Veja os Termos de Uso Complementares para Versões Prévias do Microsoft Azure para obter termos legais que se aplicam aos recursos do Azure que estão em versão beta, versão prévia ou que, de outra forma, ainda não foram lançados em disponibilidade geral.

Monitorar erros de ingestão

Para monitorar erros na ingestão de dados para métricas de workspace do Azure Monitor, use as seguintes etapas:

  1. No portal do Azure, navegue até o workspace do Azure Monitor e selecione Métricas na seção Monitoramento .

  2. Na lista suspensa Adicionar métrica, selecione Adicionar com o construtor.

  3. Selecione o workspace do Azure Monitor como escopo.

  4. Selecione Métricas Padrão para o Namespace de Métricas.

  5. Na lista suspensa Métrica, selecione Eventos Descartados e Amostras de Série Temporal Descartadas para verificar se há erros na ingestão de dados.

  6. Clique em Aplicar divisão e, na lista suspensa Valores , selecione Motivo.

    Captura de tela que mostra o gráfico de métricas para erros de ingestão no workspace do Azure Monitor.

Eventos removidos

A métrica de eventos descartados indica o número de eventos recebidos, mas que não foram aceitos no Workspace do Azure Monitor. Ele inclui uma dimensão Reason para indicar por que os eventos não são aceitos. O conjunto de razões está sujeito a mudanças no futuro para fornecer melhor fidelidade. A tabela a seguir descreve o conjunto de motivos e quais condições resultam nelas.

Motivo Descrição
Dados Antigos Os dados foram removidos porque os eventos têm marcações de tempo com mais de 20 minutos. Somente são aceitos eventos com registros de data e hora que não ultrapassem 20 minutos no passado ou 20 minutos no futuro (em relação ao tempo de ingestão).
LimitThrottling Os dados foram descartados porque os limites de ingestão foram excedidos. Solicitar um aumento nos limites de ingestão
FormatoDeEntradaIncorreto Os dados foram removidos porque o formato de entrada era inválido. Para formatos de entrada válidos, consulte Nomes de métrica, nomes de rótulo e valores de rótulo
Erro Interno Os dados foram removidos devido a um erro interno.

Amostras de série temporal descartadas

A métrica de pontos de dados da série temporal descartados indica o número de pontos de dados removidos durante o processamento (depois que o evento correspondente foi aceito). Ele inclui uma dimensão Reason para indicar por que os pontos de dados foram removidos. O conjunto de razões está sujeito a mudanças no futuro para fornecer melhor fidelidade. A tabela a seguir descreve o conjunto de motivos e quais condições resultam nelas.

Motivo Descrição
Duplicar Os dados eram uma duplicata de dados já recebidos.
OutOfOrder Os dados foram recebidos fora de ordem; os dados recebidos para uma série temporal tinham um carimbo de data/hora mais antigo do que outros dados já ingeridos para a mesma série temporal.
LimitThrottling Os dados foram rejeitados porque as novas séries temporais são limitadas no nível da conta de monitoramento. Solicitar um aumento nos limites de ingestão
InvalidTimeRange Os dados foram rejeitados porque continham um carimbo de data/hora muito longe no futuro. Somente eventos com carimbos de data/hora no máximo 20 minutos no futuro (em relação ao tempo de ingestão) são aceitos.
Dados Antigos Os dados foram rejeitados porque eram muito antigos. Somente eventos com carimbos de data/hora não mais do que 20 minutos no passado (em relação ao tempo de ingestão) são aceitos.
Erro Interno A atualização falhou devido a um erro interno.
ReservedDimensionName Os dados foram rejeitados porque continham uma ou mais chaves de dimensão/nomes de rótulo que entram em conflito com nomes de dimensão/rótulo reservados.
FormatoDeEntradaIncorreto Os dados foram descartados porque continham valores fora do intervalo de dados com suporte. Para formatos de entrada válidos, consulte Nomes de métrica, nomes de rótulo e valores de rótulo

Monitorar as solicitações de ingestão para a Regra de Coleta de Dados (versão prévia)

Quando você configura o Workspace do Azure Monitor, há limites que se aplicam às regras de coleta de dados associadas (DCR) que enviam métricas do Prometheus para o workspace do Azure Monitor. Para obter informações sobre esses limites, consulte Limites do Serviço Prometheus.

Para exibir e monitorar se os limites do DCR estão sendo controlados, siga as etapas abaixo:

  1. No portal do Azure, navegue até o workspace do Azure Monitor e clique na Regra de Coleta de Dados exibida na página Visão Geral.
  2. Na página Regra de Coleta de Dados, vá para Monitoramento ->Métricas
  3. Na lista suspensa Selecionar Métrica, selecione Solicitações de Ingestão de Métricas por Min. para ver o número de solicitações de ingestão de métricas por minuto.

Criar um alerta para acompanhar os limites de DCR

Para monitorar se a ingestão de métricas da DCR está sendo limitada, crie um alerta na dimensão Código de resposta das métricas. Em caso de limitação, o “Código de resposta” conterá o código de erro 429.

  1. Na página Regra de Coleta de Dados, vá para Monitoramento ->Alertas.

  2. Clique em + Criar ->Regra de alerta.

  3. Clique em "Ver todos os sinais" e, em seguida, Solicitações de Ingestão de Métricas por Minuto na seção Métricas. Clique em Aplicar.

  4. Revise os detalhes e insira o limite; Na seção Dividir por dimensões, selecione o Código de Resposta na lista suspensa "Nome da dimensão" e insira "429" como o valor da dimensão.

  5. Examine outros detalhes e crie o alerta.

    Captura de tela que mostra a configuração do alerta para limitação de métricas da Regra de Coleta de Dados.

Caso receba um alerta, considere a criação de DCRs e DCEs adicionais para distribuir a carga de ingestão entre vários pontos de extremidade. Essa abordagem ajuda a otimizar o desempenho e garante o manuseio eficiente de dados. Para mais informações sobre como criar DCRs e DCEs, consulte Como criar um Data Collection Endpoint (DCE) personalizado e uma Data Collection Rule (DCR) personalizada para um workspace do Azure Monitor existente para ingerir métricas do Prometheus.

Observação

Essas métricas estão atualmente em versão prévia e o suporte para essas métricas é limitado. Se necessário, você pode criar um alerta para métricas descartadas além de um determinado limite e, caso esse alerta seja recebido, examine as configurações de coleta de dados para obter as condições específicas, conforme descrito acima.

Próximas etapas