Solução de Estado de Funcionamento do Agente no Azure Monitor
A solução Integridade do Agente no Azure ajuda você a entender quais agentes de monitoramento não estão respondendo e enviando dados operacionais. Isso inclui todos os agentes que se reportam diretamente ao espaço de trabalho do Log Analytics no Azure Monitor ou a um grupo de gerenciamento do System Center Operations Manager conectado ao Azure Monitor.
Você também pode usar a solução Agent Health para:
- Acompanhe quantos agentes são implantados e onde eles estão distribuídos geograficamente.
- Execute outras consultas para manter o conhecimento da distribuição de agentes implantados no Azure, em outros ambientes de nuvem ou localmente.
Importante
A solução de Integridade do Agente monitora apenas a integridade do agente do Log Analytics que foi preterido a partir de 31 de agosto de 2024. Esta solução não monitoriza o estado de funcionamento do agente do Azure Monitor.
Pré-requisitos
Antes de implantar essa solução, confirme se você deu suporte a agentes do Windows que relatam para o espaço de trabalho do Log Analytics ou relatórios para um grupo de gerenciamento do Operations Manager integrado ao seu espaço de trabalho.
Pacotes de gestão
Se o grupo de gerenciamento do Operations Manager estiver conectado a um espaço de trabalho do Log Analytics, os seguintes pacotes de gerenciamento serão instalados no Operations Manager. Esses pacotes de gerenciamento também são instalados em computadores Windows conectados diretamente depois que você adiciona esta solução:
- Pacote de Informações de Canal Direto de HealthAssessment do Microsoft System Center Advisor (Microsoft.IntelligencePacks.HealthAssessmentDirect)
- Pacote de inteligência de canal do Microsoft System Center Advisor HealthAssessment Server (Microsoft.IntelligencePacks.HealthAssessmentViaServer)
Não há nada para configurar ou gerenciar com esses pacotes de gerenciamento. Para obter mais informações sobre como são atualizados os pacotes de gestão da solução, veja Connect Operations Manager to Log Analytics (Ligar o Operations Manager ao Log Analytics).
Configuração
Adicione a solução Integridade do Agente ao seu espaço de trabalho do Log Analytics usando o processo descrito em Adicionar soluções. Não é necessário efetuar mais configurações.
Agentes suportados
A tabela a seguir descreve as fontes conectadas suportadas por essa solução.
Origem ligada | Suportado | Description |
---|---|---|
Agentes do Windows | Sim | Os eventos de heartbeat são recolhidos de agentes do Windows diretos. |
Grupo de gestão do System Center Operations Manager | Sim | Os eventos de pulsação são coletados de agentes que relatam ao grupo de gerenciamento a cada 60 segundos e, em seguida, são encaminhados para o Azure Monitor. Não é necessária uma conexão direta dos agentes do Operations Manager com o Azure Monitor. Os dados de eventos de pulsação são encaminhados do grupo de gerenciamento para o espaço de trabalho do Log Analytics. |
Utilize a solução
Quando você adiciona a solução ao seu espaço de trabalho do Log Analytics, o bloco Integridade do Agente é adicionado ao seu painel. Esse mosaico mostra o número total de agentes e o número de agentes sem resposta nas últimas 24 horas.
Selecione o bloco Integridade do Agente para abrir o painel Integridade do Agente. O dashboard inclui as colunas da tabela seguinte. Cada coluna lista os 10 principais eventos por contagem que correspondem aos critérios dessa coluna para o intervalo de tempo especificado. Você pode executar uma pesquisa de log que fornece a lista inteira. Selecione Ver tudo abaixo de cada coluna ou selecione o título da coluna.
Column | Description |
---|---|
Contagem de agentes ao longo do tempo | Uma tendência de contagem de agentes durante um período de sete dias para agentes Linux e Windows |
Contagem de agentes sem resposta | Uma lista de agentes que não enviaram um batimento cardíaco nas últimas 24 horas |
Distribuição por tipo de SO | Uma partição de quantos agentes Windows e Linux você tem em seu ambiente |
Distribuição por versão do agente | Uma partição das versões do agente instaladas em seu ambiente e uma contagem de cada uma |
Distribuição por categoria de agente | Uma partição das categorias de agentes que estão enviando eventos de pulsação: agentes diretos, agentes do Operations Manager ou o servidor de gerenciamento do Operations Manager |
Distribuição por grupo de gestão | Uma partição dos grupos de gerenciamento do Operations Manager em seu ambiente |
Geolocalização dos agentes | Uma partição dos países/regiões onde você tem agentes e uma contagem total do número de agentes que foram instalados em cada país/região |
Contagem de gateways instalados | O número de servidores que têm o gateway do Log Analytics instalado e uma lista desses servidores |
Registos de registo do Azure Monitor
A solução cria um tipo de registro no espaço de trabalho do Log Analytics: pulsação. Os registros de pulsação têm as propriedades listadas na tabela a seguir.
Property | Description |
---|---|
Type |
Heartbeat |
Category |
Direct Agent , SCOM Agent ou SCOM Management Server |
Computer |
Nome do computador |
OSType |
Sistema operacional Windows ou Linux |
OSMajorVersion |
Versão principal do sistema operacional |
OSMinorVersion |
Versão secundária do sistema operacional |
Version |
Versão do agente do Log Analytics ou do agente do Operations Manager |
SCAgentChannel |
Direct e/ou SCManagementServer |
IsGatewayInstalled |
true se o gateway do Log Analytics estiver instalado; caso contrário, false |
ComputerIP |
Endereço IP público para uma máquina virtual do Azure, se disponível; Endereço SNAT do Azure (não o endereço IP privado) para uma máquina virtual que usa um IP privado |
ComputerPrivateIPs |
Lista de IPs privados do computador |
RemoteIPCountry |
Localização geográfica onde o computador está implantado |
ManagementGroupName |
Nome do grupo de gestão do Operations Manager |
SourceComputerId |
ID exclusivo do computador |
RemoteIPLongitude |
Longitude da localização geográfica do computador |
RemoteIPLatitude |
Latitude da localização geográfica do computador |
Cada agente que se reporta a um servidor de gerenciamento do Operations Manager enviará duas pulsações. O SCAgentChannel
valor da propriedade incluirá ambos e Direct
SCManagementServer
, dependendo de quais fontes de dados e soluções de monitoramento você habilitou em sua assinatura.
Se você se lembrar, os dados das soluções são enviados:
- Diretamente de um servidor de gerenciamento do Operations Manager para o Azure Monitor.
- Diretamente do agente para o Azure Monitor, devido ao volume de dados coletados no agente.
Para eventos de pulsação que têm o valor SCManagementServer
, o ComputerIP
valor é o endereço IP do servidor de gerenciamento porque ele realmente carrega os dados. Para pulsações onde SCAgentChannel
está definido como Direct
, é o endereço IP público do agente.
Pesquisas de registos de exemplo
A tabela a seguir fornece pesquisas de log de exemplo para registros que a solução coleta.
Query | Description |
---|---|
Batimento cardíaco | Computador distinto | Número total de agentes |
Batimento cardíaco | resumir LastCall = max(TimeGenerated) por computador | onde LastCall < ago(24h) | Contagem de agentes sem resposta nas últimas 24 horas |
Batimento cardíaco | resumir LastCall = max(TimeGenerated) por computador | onde LastCall < ago(15m) | Contagem de agentes sem resposta nos últimos 15 minutos |
Batimento cardíaco | onde TimeGenerated > ago(24h) e Computer in ((Heartbeat | where TimeGenerated > ago(24h) | distinct Computer)) | summarize LastCall = max(TimeGenerated) by Computer | Computadores online nas últimas 24 horas |
Batimento cardíaco | onde TimeGenerated > ago(24h) e Computer !in ((Heartbeat | where TimeGenerated > ago(30m) | distinct Computer)) | summarize LastCall = max(TimeGenerated) by Computer | Total de agentes offline nos últimos 30 minutos (nas últimas 24 horas) |
Batimento cardíaco | resumir AggregatedValue = dcount(Computer) por OSType | Tendência do número de agentes ao longo do tempo por tipo de SO |
Batimento cardíaco | resumir AggregatedValue = dcount(Computer) por OSType | Distribuição por tipo de SO |
Batimento cardíaco | resumir AggregatedValue = dcount(Computer) por Versão | Distribuição por versão do agente |
Batimento cardíaco | resumir AggregatedValue = count() por Categoria | Distribuição por categoria de agente |
Batimento cardíaco | resumir AggregatedValue = dcount(Computer) por ManagementGroupName | Distribuição por grupo de gestão |
Batimento cardíaco | resumir AggregatedValue = dcount(Computer) por RemoteIPCountry | Geolocalização dos agentes |
Batimento cardíaco | onde iff(isnotnull(toint(IsGatewayInstalled)), IsGatewayInstalled == true, IsGatewayInstalled == "true") == true | Computador distinto | Número de gateways do Log Analytics instalados |
Próximos passos
Saiba mais sobre como gerar alertas de consultas de log no Azure Monitor.