Documentação de orientação para a resolução de problemas do agente do Azure Monitor em máquinas virtuais e conjuntos de dimensionamento do Linux
Descrição geral do agente do Azure Monitor
Antes de ler mais, tem de estar familiarizado com o agente do Azure Monitor e com as Regras de Recolha de Dados.
Terminologia
Name | Acrónimo | Description |
---|---|---|
Agente do Azure Monitor | AMA | O novo agente do Azure Monitor |
Regras de Recolha de Dados | DCR | Regras para configurar a recolha de dados pelo agente, ou seja, o que recolher, para onde enviar e muito mais |
Serviço de Configuração do Azure Monitor | AMCS | Serviço regional alojado no Azure, que controla a recolha de dados para este agente e outras partes do Azure Monitor. O agente chama este serviço para obter DCRs. |
Ponto final de registos | -- | Ponto final para enviar dados para áreas de trabalho do Log Analytics |
Ponto final de métricas | -- | Ponto final para enviar dados para bases de dados de Métricas do Azure Monitor. |
Serviço de Metadados de Instância e Híbrido | IMDS e HIMDS | Serviços alojados no Azure que fornecem informações sobre máquinas virtuais atualmente em execução, conjuntos de dimensionamento (através de IMDS) e servidores compatíveis com o Arc (via HIMDS), respetivamente |
Área de trabalho do Log Analytics | LEI | O destino no Azure Monitor para o qual pode enviar registos recolhidos pelo agente |
Métricas Personalizadas | -- | O destino no Azure Monitor para o qual pode enviar métricas de convidado recolhidas pelo agente |
Passos de resolução de problemas básicos
Siga os passos abaixo para resolver o problema da versão mais recente do agente do Azure Monitor em execução na máquina virtual do Linux:
Reveja cuidadosamente os pré-requisitos aqui.
Verifique se a extensão foi instalada e aprovisionada com êxito, que instala os binários do agente no seu computador:
- Abra portal do Azure > selecione a máquina > virtual Abrir Definições: Extensões + aplicações no painel à esquerda > "AzureMonitorLinuxAgent" deve aparecer com o Estado: "Aprovisionamento com êxito"
- Se não vir a extensão listada, verifique se o computador consegue aceder ao Azure e localize a extensão a instalar com o comando abaixo:
az vm extension image list-versions --location <machine-region> --name AzureMonitorLinuxAgent --publisher Microsoft.Azure.Monitor
- Aguarde 10 a 15 minutos como extensão, talvez no estado de transição. Se ainda não aparecer como acima, desinstale e instale novamente a extensão .
- Verifique se vê erros nos registos de extensões localizados no
/var/log/azure/Microsoft.Azure.Monitor.AzureMonitorLinuxAgent/
seu computador - Se nenhuma das opções acima ajudar, submeta um pedido de suporte com o Resumo como "A extensão AMA falha ao instalar ou aprovisionar" e Tipo de problema como "Preciso de ajuda com o Agente Linux do Azure Monitor".
Verifique se o agente está em execução:
- Verifique se o agente está a emitir registos de heartbeat para a área de trabalho do Log Analytics com a consulta abaixo. Ignore se "Métricas Personalizadas" é o único destino no DCR:
Heartbeat | where Category == "Azure Monitor Agent" and Computer == "<computer-name>" | take 10
- Verifique se o serviço do agente está em execução
systemctl status azuremonitoragent
- Verifique se vê erros nos registos do agente principal localizados no
/var/opt/microsoft/azuremonitoragent/log/mdsd.*
computador - Se nenhuma das opções acima ajudar, crie um pedido de suporte com o Resumo como "Extensão AMA aprovisionada, mas não em execução" e Tipo de problema como "Preciso de ajuda com o Agente Linux do Azure Monitor".
- Verifique se o agente está a emitir registos de heartbeat para a área de trabalho do Log Analytics com a consulta abaixo. Ignore se "Métricas Personalizadas" é o único destino no DCR:
Verifique se o DCR existe e está associado à máquina virtual:
- Se utilizar a área de trabalho do Log Analytics como destino, verifique se o DCR existe na mesma região física que a área de trabalho do Log Analytics.
- Abra portal do Azure > selecione a regra > de recolha de dados Abrir Configuração: Recursos no painel à esquerda > Deverá ver a máquina virtual listada aqui.
- Se não estiver listado, clique em "Adicionar" e selecione a máquina virtual no seletor de recursos. Repita em todos os DCRs.
- Se nenhuma das opções acima ajudar, crie um pedido de suporte com o Resumo como "DCR não encontrado ou associado" e Tipo de problema como "Preciso de ajuda para configurar a recolha de dados a partir de uma VM".
Verifique se o agente conseguiu transferir os DCR(s) associados do serviço AMCS:
- Verifique se vê o DCR mais recente transferido nesta localização
/etc/opt/microsoft/azuremonitoragent/config-cache/configchunks/
- Caso contrário, crie um pedido de suporte com o Resumo como "AMA não consegue transferir a configuração DCR" e Tipo de problema como "Preciso de ajuda com o Agente Linux do Azure Monitor".
- Verifique se vê o DCR mais recente transferido nesta localização
Problemas ao recolher o Syslog
Para obter mais informações sobre como resolver problemas de syslog com o Agente do Azure Monitor, veja aqui.
O ficheiro
/var/opt/microsoft/azuremonitoragent/log/mdsd.qos
de qualidade de serviço (QoS) fornece agregações de 15 minutos de formato CSV dos eventos processados e contém as informações sobre a quantidade de eventos de syslog processados no período de tempo especificado. Este ficheiro é útil para controlar as quedas de ingestão de eventos do Syslog.Por exemplo, o fragmento abaixo mostra que nos 15 minutos anteriores a 2022-02-28T19:55:23.5432920Z, o agente recebeu 77 eventos syslog com informações de nível e da daemon de instalação e enviou 77 desses eventos para a tarefa de carregamento. Além disso, a tarefa de carregamento do agente recebeu 77 e carregou com êxito todas estas 77 mensagens daemon.info.
#Time: 2022-02-28T19:55:23.5432920Z #Fields: Operation,Object,TotalCount,SuccessCount,Retries,AverageDuration,AverageSize,AverageDelay,TotalSize,TotalRowsRead,TotalRowsSent ... MaRunTaskLocal,daemon.debug,15,15,0,60000,0,0,0,0,0 MaRunTaskLocal,daemon.info,15,15,0,60000,46.2,0,693,77,77 MaRunTaskLocal,daemon.notice,15,15,0,60000,0,0,0,0,0 MaRunTaskLocal,daemon.warning,15,15,0,60000,0,0,0,0,0 MaRunTaskLocal,daemon.error,15,15,0,60000,0,0,0,0,0 MaRunTaskLocal,daemon.critical,15,15,0,60000,0,0,0,0,0 MaRunTaskLocal,daemon.alert,15,15,0,60000,0,0,0,0,0 MaRunTaskLocal,daemon.emergency,15,15,0,60000,0,0,0,0,0 ... MaODSRequest,https://e73fd5e3-ea2b-4637-8da0-5c8144b670c8_LogManagement,15,15,0,455067,476.467,0,7147,77,77
Passos de resolução de problemas
- Veja primeiro os passos genéricos de resolução de problemas da AMA do Linux . Se o agente estiver a emitir heartbeats, avance para o passo 2.
- A configuração analisada é armazenada em
/etc/opt/microsoft/azuremonitoragent/config-cache/configchunks/
. Verifique se a coleção Syslog está definida e se os destinos de registo são os mesmos que foram construídos na IU dcR/DCR JSON.- Se sim, avance para o passo 3. Caso contrário, o problema está no fluxo de trabalho de configuração.
- Investigue
mdsd.err
osmdsd.warn
mdsd.info
ficheiros em/var/opt/microsoft/azuremonitoragent/log
para possíveis erros de configuração. - Se nenhuma das opções acima ajudar, crie um pedido de suporte com o Resumo como "O DCR do Syslog não está disponível" e Escreva Problema como "Preciso de ajuda para configurar a recolha de dados a partir de uma VM".
- Valide o esquema do fluxo de trabalho da coleção Syslog para garantir que todas as peças necessárias estão implementadas e acessíveis:
- Para
rsyslog
os utilizadores, certifique-se de que o/etc/rsyslog.d/10-azuremonitoragent.conf
ficheiro está presente, não está vazio e está acessível pelorsyslog
daemon (utilizador do syslog).- Verifique a configuração do rsyslog em
/etc/rsyslog.conf
e/etc/rsyslog.d/*
para ver se tem entradas vinculadas a um conjunto de regras não predefinido, uma vez que as mensagens destas entradas não serão reencaminhadas para o Agente do Azure Monitor. Por exemplo, as mensagens de uma entrada configurada com um conjunto de regras não predefinido comoinput(type="imtcp" port="514"
ruleset="myruleset"
)
não serão reencaminhadas.
- Verifique a configuração do rsyslog em
- Para
syslog-ng
os utilizadores, certifique-se de que o/etc/syslog-ng/conf.d/azuremonitoragent.conf
ficheiro está presente, não está vazio e está acessível pelosyslog-ng
daemon (utilizador do syslog). - Certifique-se de que o ficheiro
/run/azuremonitoragent/default_syslog.socket
existe e está acessível porrsyslog
ousyslog-ng
respetivamente. - Verifique se existe uma redução correspondente na contagem de eventos de syslog processados no
/var/opt/microsoft/azuremonitoragent/log/mdsd.qos
. Se essa entrega não for indicada no ficheiro, submeta um pedido com o Resumo como "Dados do Syslog removidos no pipeline" e Tipo de problema como "Preciso de ajuda com o Agente Linux do Azure Monitor". - Verifique se a fila do daemon do syslog não está a exceder o limite, o que faz com que o carregamento falhe, ao referenciar a documentação de orientação aqui: dados do Rsyslog não carregados devido a um problema de espaço em Disco Inteiro no Agente Linux da AMA
- Para
- Para depurar ainda mais a ingestão de eventos do syslog, pode acrescentar o sinalizador de rastreio -T 0x2002 no final do MDSD_OPTIONS no ficheiro
/etc/default/azuremonitoragent
e reiniciar o agente:export MDSD_OPTIONS="-A -c /etc/opt/microsoft/azuremonitoragent/mdsd.xml -d -r $MDSD_ROLE_PREFIX -S $MDSD_SPOOL_DIRECTORY/eh -L $MDSD_SPOOL_DIRECTORY/events -e $MDSD_LOG_DIR/mdsd.err -w $MDSD_LOG_DIR/mdsd.warn -o $MDSD_LOG_DIR/mdsd.info -T 0x2002"
- Depois de o problema ser reproduzido com o sinalizador de rastreio ativado, encontrará mais informações de depuração no
/var/opt/microsoft/azuremonitoragent/log/mdsd.info
. Inspecione o ficheiro quanto à possível causa do problema de recolha do syslog, como análise/processamento/configuração/erros de carregamento.Aviso
Certifique-se de que remove a definição do sinalizador de rastreio -T 0x2002 após a sessão de depuração, uma vez que gera muitas instruções de rastreio que podem preencher o disco mais rapidamente ou dificultar a análise visual do ficheiro de registo.
- Se nenhuma das opções acima ajudar, crie um pedido de suporte com o Resumo , uma vez que "o AMA não recolhe eventos do syslog" e o Tipo de problema como "Preciso de ajuda com o Agente Linux do Azure Monitor".
Resolver problemas no servidor compatível com o Arc
Se depois de verificar os passos básicos de resolução de problemas não vir os registos emitidos pelo Agente do Azure Monitor ou encontrar erros "Falha ao obter o token MSI do ponto final do IMDS" no /var/opt/microsoft/azuremonitoragent/log/mdsd.err
ficheiro de registo, é provável syslog
que o utilizador não seja membro do grupo himds
. Adicione syslog
o utilizador ao himds
grupo de utilizadores se o utilizador não for membro deste grupo. Crie o utilizador syslog
e o grupo syslog
, se necessário, e certifique-se de que o utilizador está nesse grupo. Para obter mais informações, veja os requisitos de autenticação do servidor compatível com o Azure Arc aqui.
Arquivar um pedido de suporte
- Abra uma regra de recolha de dados e, no menu à esquerda, selecione Novo Pedido de Suporte. Também pode abrir o painel Ajuda + suporte e selecionar Criar um pedido de suporte.
- Selecione:
- Tipo de problema: Técnico.
- Subscrição: selecione a subscrição onde os seus computadores residem.
- Tipo de serviço: regras de recolha de dados e Agente do Azure Monitor.
- O problema está relacionado com um recurso?: Sim. Selecione o computador com o seletor de recursos.
- Introduza Resumo e Tipo de problema conforme indicado nos passos de resolução de problemas. Informações precisas levam a uma resolução mais rápida do problema.
- Selecione Seguinte e reveja as soluções recomendadas para ver se ajudam.
- Se não ajudarem, selecione Seguinte e preencha o próximo conjunto de detalhes.
- Selecione Seguinte, reveja os detalhes finais e selecione Criar.