Share via


Documentação de orientação para a resolução de problemas do agente do Azure Monitor em máquinas virtuais e conjuntos de dimensionamento do Linux

Descrição geral do agente do Azure Monitor

Antes de ler mais, tem de estar familiarizado com o agente do Azure Monitor e com as Regras de Recolha de Dados.

Terminologia

Name Acrónimo Description
Agente do Azure Monitor AMA O novo agente do Azure Monitor
Regras de Recolha de Dados DCR Regras para configurar a recolha de dados pelo agente, ou seja, o que recolher, para onde enviar e muito mais
Serviço de Configuração do Azure Monitor AMCS Serviço regional alojado no Azure, que controla a recolha de dados para este agente e outras partes do Azure Monitor. O agente chama este serviço para obter DCRs.
Ponto final de registos -- Ponto final para enviar dados para áreas de trabalho do Log Analytics
Ponto final de métricas -- Ponto final para enviar dados para bases de dados de Métricas do Azure Monitor.
Serviço de Metadados de Instância e Híbrido IMDS e HIMDS Serviços alojados no Azure que fornecem informações sobre máquinas virtuais atualmente em execução, conjuntos de dimensionamento (através de IMDS) e servidores compatíveis com o Arc (via HIMDS), respetivamente
Área de trabalho do Log Analytics LEI O destino no Azure Monitor para o qual pode enviar registos recolhidos pelo agente
Métricas Personalizadas -- O destino no Azure Monitor para o qual pode enviar métricas de convidado recolhidas pelo agente

Passos de resolução de problemas básicos

Siga os passos abaixo para resolver o problema da versão mais recente do agente do Azure Monitor em execução na máquina virtual do Linux:

  1. Reveja cuidadosamente os pré-requisitos aqui.

  2. Verifique se a extensão foi instalada e aprovisionada com êxito, que instala os binários do agente no seu computador:

    1. Abra portal do Azure > selecione a máquina > virtual Abrir Definições: Extensões + aplicações no painel à esquerda > "AzureMonitorLinuxAgent" deve aparecer com o Estado: "Aprovisionamento com êxito"
    2. Se não vir a extensão listada, verifique se o computador consegue aceder ao Azure e localize a extensão a instalar com o comando abaixo:
      az vm extension image list-versions --location <machine-region> --name AzureMonitorLinuxAgent --publisher Microsoft.Azure.Monitor
      
    3. Aguarde 10 a 15 minutos como extensão, talvez no estado de transição. Se ainda não aparecer como acima, desinstale e instale novamente a extensão .
    4. Verifique se vê erros nos registos de extensões localizados no /var/log/azure/Microsoft.Azure.Monitor.AzureMonitorLinuxAgent/ seu computador
    5. Se nenhuma das opções acima ajudar, submeta um pedido de suporte com o Resumo como "A extensão AMA falha ao instalar ou aprovisionar" e Tipo de problema como "Preciso de ajuda com o Agente Linux do Azure Monitor".
  3. Verifique se o agente está em execução:

    1. Verifique se o agente está a emitir registos de heartbeat para a área de trabalho do Log Analytics com a consulta abaixo. Ignore se "Métricas Personalizadas" é o único destino no DCR:
      Heartbeat | where Category == "Azure Monitor Agent" and Computer == "<computer-name>" | take 10
      
    2. Verifique se o serviço do agente está em execução
      systemctl status azuremonitoragent
      
    3. Verifique se vê erros nos registos do agente principal localizados no /var/opt/microsoft/azuremonitoragent/log/mdsd.* computador
    4. Se nenhuma das opções acima ajudar, crie um pedido de suporte com o Resumo como "Extensão AMA aprovisionada, mas não em execução" e Tipo de problema como "Preciso de ajuda com o Agente Linux do Azure Monitor".
  4. Verifique se o DCR existe e está associado à máquina virtual:

    1. Se utilizar a área de trabalho do Log Analytics como destino, verifique se o DCR existe na mesma região física que a área de trabalho do Log Analytics.
    2. Abra portal do Azure > selecione a regra > de recolha de dados Abrir Configuração: Recursos no painel à esquerda > Deverá ver a máquina virtual listada aqui.
    3. Se não estiver listado, clique em "Adicionar" e selecione a máquina virtual no seletor de recursos. Repita em todos os DCRs.
    4. Se nenhuma das opções acima ajudar, crie um pedido de suporte com o Resumo como "DCR não encontrado ou associado" e Tipo de problema como "Preciso de ajuda para configurar a recolha de dados a partir de uma VM".
  5. Verifique se o agente conseguiu transferir os DCR(s) associados do serviço AMCS:

    1. Verifique se vê o DCR mais recente transferido nesta localização /etc/opt/microsoft/azuremonitoragent/config-cache/configchunks/
    2. Caso contrário, crie um pedido de suporte com o Resumo como "AMA não consegue transferir a configuração DCR" e Tipo de problema como "Preciso de ajuda com o Agente Linux do Azure Monitor".

Problemas ao recolher o Syslog

Para obter mais informações sobre como resolver problemas de syslog com o Agente do Azure Monitor, veja aqui.

  • O ficheiro /var/opt/microsoft/azuremonitoragent/log/mdsd.qos de qualidade de serviço (QoS) fornece agregações de 15 minutos de formato CSV dos eventos processados e contém as informações sobre a quantidade de eventos de syslog processados no período de tempo especificado. Este ficheiro é útil para controlar as quedas de ingestão de eventos do Syslog.

    Por exemplo, o fragmento abaixo mostra que nos 15 minutos anteriores a 2022-02-28T19:55:23.5432920Z, o agente recebeu 77 eventos syslog com informações de nível e da daemon de instalação e enviou 77 desses eventos para a tarefa de carregamento. Além disso, a tarefa de carregamento do agente recebeu 77 e carregou com êxito todas estas 77 mensagens daemon.info.

    #Time: 2022-02-28T19:55:23.5432920Z
    #Fields: Operation,Object,TotalCount,SuccessCount,Retries,AverageDuration,AverageSize,AverageDelay,TotalSize,TotalRowsRead,TotalRowsSent
    ...
    MaRunTaskLocal,daemon.debug,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.info,15,15,0,60000,46.2,0,693,77,77
    MaRunTaskLocal,daemon.notice,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.warning,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.error,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.critical,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.alert,15,15,0,60000,0,0,0,0,0
    MaRunTaskLocal,daemon.emergency,15,15,0,60000,0,0,0,0,0
    ...
    MaODSRequest,https://e73fd5e3-ea2b-4637-8da0-5c8144b670c8_LogManagement,15,15,0,455067,476.467,0,7147,77,77
    

Passos de resolução de problemas

  1. Veja primeiro os passos genéricos de resolução de problemas da AMA do Linux . Se o agente estiver a emitir heartbeats, avance para o passo 2.
  2. A configuração analisada é armazenada em /etc/opt/microsoft/azuremonitoragent/config-cache/configchunks/. Verifique se a coleção Syslog está definida e se os destinos de registo são os mesmos que foram construídos na IU dcR/DCR JSON.
    1. Se sim, avance para o passo 3. Caso contrário, o problema está no fluxo de trabalho de configuração.
    2. Investigue mdsd.errosmdsd.warnmdsd.info ficheiros em /var/opt/microsoft/azuremonitoragent/log para possíveis erros de configuração.
    3. Se nenhuma das opções acima ajudar, crie um pedido de suporte com o Resumo como "O DCR do Syslog não está disponível" e Escreva Problema como "Preciso de ajuda para configurar a recolha de dados a partir de uma VM".
  3. Valide o esquema do fluxo de trabalho da coleção Syslog para garantir que todas as peças necessárias estão implementadas e acessíveis:
    1. Para rsyslog os utilizadores, certifique-se de que o /etc/rsyslog.d/10-azuremonitoragent.conf ficheiro está presente, não está vazio e está acessível pelo rsyslog daemon (utilizador do syslog).
      1. Verifique a configuração do rsyslog em /etc/rsyslog.conf e /etc/rsyslog.d/* para ver se tem entradas vinculadas a um conjunto de regras não predefinido, uma vez que as mensagens destas entradas não serão reencaminhadas para o Agente do Azure Monitor. Por exemplo, as mensagens de uma entrada configurada com um conjunto de regras não predefinido como input(type="imtcp" port="514" ruleset="myruleset") não serão reencaminhadas.
    2. Para syslog-ng os utilizadores, certifique-se de que o /etc/syslog-ng/conf.d/azuremonitoragent.conf ficheiro está presente, não está vazio e está acessível pelo syslog-ng daemon (utilizador do syslog).
    3. Certifique-se de que o ficheiro /run/azuremonitoragent/default_syslog.socket existe e está acessível por rsyslog ou syslog-ng respetivamente.
    4. Verifique se existe uma redução correspondente na contagem de eventos de syslog processados no /var/opt/microsoft/azuremonitoragent/log/mdsd.qos. Se essa entrega não for indicada no ficheiro, submeta um pedido com o Resumo como "Dados do Syslog removidos no pipeline" e Tipo de problema como "Preciso de ajuda com o Agente Linux do Azure Monitor".
    5. Verifique se a fila do daemon do syslog não está a exceder o limite, o que faz com que o carregamento falhe, ao referenciar a documentação de orientação aqui: dados do Rsyslog não carregados devido a um problema de espaço em Disco Inteiro no Agente Linux da AMA
  4. Para depurar ainda mais a ingestão de eventos do syslog, pode acrescentar o sinalizador de rastreio -T 0x2002 no final do MDSD_OPTIONS no ficheiro /etc/default/azuremonitoragente reiniciar o agente:
    export MDSD_OPTIONS="-A -c /etc/opt/microsoft/azuremonitoragent/mdsd.xml -d -r $MDSD_ROLE_PREFIX -S $MDSD_SPOOL_DIRECTORY/eh -L $MDSD_SPOOL_DIRECTORY/events -e $MDSD_LOG_DIR/mdsd.err -w $MDSD_LOG_DIR/mdsd.warn -o $MDSD_LOG_DIR/mdsd.info -T 0x2002"
    
  5. Depois de o problema ser reproduzido com o sinalizador de rastreio ativado, encontrará mais informações de depuração no /var/opt/microsoft/azuremonitoragent/log/mdsd.info. Inspecione o ficheiro quanto à possível causa do problema de recolha do syslog, como análise/processamento/configuração/erros de carregamento.

    Aviso

    Certifique-se de que remove a definição do sinalizador de rastreio -T 0x2002 após a sessão de depuração, uma vez que gera muitas instruções de rastreio que podem preencher o disco mais rapidamente ou dificultar a análise visual do ficheiro de registo.

  6. Se nenhuma das opções acima ajudar, crie um pedido de suporte com o Resumo , uma vez que "o AMA não recolhe eventos do syslog" e o Tipo de problema como "Preciso de ajuda com o Agente Linux do Azure Monitor".

Resolver problemas no servidor compatível com o Arc

Se depois de verificar os passos básicos de resolução de problemas não vir os registos emitidos pelo Agente do Azure Monitor ou encontrar erros "Falha ao obter o token MSI do ponto final do IMDS" no /var/opt/microsoft/azuremonitoragent/log/mdsd.err ficheiro de registo, é provável syslog que o utilizador não seja membro do grupo himds. Adicione syslog o utilizador ao himds grupo de utilizadores se o utilizador não for membro deste grupo. Crie o utilizador syslog e o grupo syslog, se necessário, e certifique-se de que o utilizador está nesse grupo. Para obter mais informações, veja os requisitos de autenticação do servidor compatível com o Azure Arc aqui.

Arquivar um pedido de suporte

  1. Abra uma regra de recolha de dados e, no menu à esquerda, selecione Novo Pedido de Suporte. Também pode abrir o painel Ajuda + suporte e selecionar Criar um pedido de suporte.
  2. Selecione:
    • Tipo de problema: Técnico.
    • Subscrição: selecione a subscrição onde os seus computadores residem.
    • Tipo de serviço: regras de recolha de dados e Agente do Azure Monitor.
    • O problema está relacionado com um recurso?: Sim. Selecione o computador com o seletor de recursos.
  3. Introduza Resumo e Tipo de problema conforme indicado nos passos de resolução de problemas. Informações precisas levam a uma resolução mais rápida do problema.
  4. Selecione Seguinte e reveja as soluções recomendadas para ver se ajudam.
  5. Se não ajudarem, selecione Seguinte e preencha o próximo conjunto de detalhes.
  6. Selecione Seguinte, reveja os detalhes finais e selecione Criar.