Compartilhar via


Principais conceitos do Operations Manager

O Operations Manager, um componente do Microsoft System Center, é um software que ajuda a monitorar serviços, dispositivos e operações de vários computadores a partir de um único console. Este artigo explica os conceitos básicos sobre o Operations Manager para o administrador que gerencia a infraestrutura do Operations Manager e o operador que monitora e dá suporte aos serviços de TI para sua empresa.

O que o Operations Manager faz

Empresas pequenas e grandes geralmente são dependentes de serviços e aplicativos fornecidos pelo ambiente de computação. Os departamentos de TI são responsáveis por garantir o desempenho e disponibilidade desses serviços e aplicativos essenciais. Isso significa que os departamentos de TI precisam saber quando há um problema, identificar onde está o problema e descobrir o que está causando o problema, idealmente antes que os usuários dos aplicativos encontrem os problemas. Quanto mais computadores e dispositivos no negócio, mais desafiadora essa tarefa se torna.

Usar o Operations Manager no ambiente facilita o monitoramento de vários computadores, dispositivos, serviços e aplicativos. O console de Operações, mostrado na imagem a seguir, permite que você verifique a integridade, o desempenho e a disponibilidade de todos os objetos monitorados no ambiente e ajuda a identificar e resolver problemas.

Captura de tela do Console de Operações.

Observação

Para saber mais sobre os consoles do Operations Manager, consulte Comparando os consoles do Operations Manager no Guia de Operações.

O Operations Manager informará quais objetos monitorados não estão íntegros, enviará alertas quando problemas forem identificados e fornecerá informações para ajudá-lo a identificar a causa de um problema e possíveis soluções. Como o administrador, você configura o que será monitorado ao selecionar computadores e dispositivos a serem monitorados e ao importar pacotes de gerenciamento que fornecem monitoramento para recursos e aplicativos específicos. Para decidir que objetos monitorar e para que monitorar, será necessário entender os recursos que compreendem a infraestrutura do Operations Manager e como o Operations Manager funciona.

A infraestrutura do Operations Manager

A instalação do Operations Manager cria um grupo de gerenciamento. O grupo de gerenciamento é a unidade básica de funcionalidade. No mínimo, o grupo de gerenciamento consiste de um servidor de gerenciamento, o banco de dados operacionale o banco de dados do data warehouse de relatórios.

  • O servidor de gerenciamento é o ponto focal para administrar o grupo de gerenciamento e comunicação com o banco de dados. Ao abrir o console de operações e se conectar a um grupo de gerenciamento, você se conecta a um servidor de gerenciamento para esse grupo de gerenciamento. Dependendo do tamanho do seu ambiente de computação, um grupo de gerenciamento pode conter um servidor de gerenciamento único ou diversos servidores de gerenciamento.

  • O banco de dados operacional é um banco de dados do SQL Server que contém todos os dados de configuração para o grupo de gerenciamento e armazena todos os dados coletados e processados para o grupo de gerenciamento. O banco de dados operacional retém dados de curto prazo, por padrão, 7 dias.

  • O banco de dados do data warehouse é um banco de dados do SQL Server que armazena dados de monitoramento e alertas para fins de histórico. Os dados gravados no banco de dados do Operations Manager também são gravados no banco de dados do data warehouse, de modo que os relatórios sempre contêm dados atuais. O banco de dados do data warehouse retém dados de longo prazo.

Quando a funcionalidade de relatório do Operations Manager é instalada, o grupo de gerenciamento também contém um servidor de relatórios, que cria e apresenta relatórios de dados no banco de dados do data warehouse.

Estes componentes essenciais de um grupo de gerenciamento podem existir em um único servidor, ou podem ser distribuídos entre diversos servidores, como exibido na imagem a seguir.

Ilustração do grupo de gerenciamento básico.

Para obter informações sobre como instalar recursos do grupo de gerenciamento, consulte o Guia de Implantação do Operations Manager.

Servidores de gerenciamento

A função do servidor de gerenciamento é administrar a configuração do grupo de gerenciamento, administrar e se comunicar com agentes e se comunicar com bancos de dados no grupo de gerenciamento.

O grupo de gerenciamento pode conter vários servidores de gerenciamento para fornecer capacidade adicional e disponibilidade contínua. Quando dois ou mais servidores de gerenciamento são adicionados a um grupo de gerenciamento, os servidores se tornam parte de um pool de recursos e o trabalho é disseminado entre os membros do pool. Quando um membro do pool de recursos falhar, outros membros no pool de recursos assumirão a carga de trabalho desse membro. Quando um novo servidor de gerenciamento é adicionado, o novo servidor de gerenciamento seleciona automaticamente parte do trabalho dos membros existentes no pool de recursos. Todos os membros do pool de recursos gerenciarão um conjunto distinto de objetos remotos; A qualquer momento, dois membros no mesmo pool não gerenciarão o mesmo objeto ao mesmo tempo.

Um tipo especializado de servidor de gerenciamento é o servidor gateway. Um servidor gateway permite o monitoramento de computadores em domínios não confiáveis. Para obter mais informações, consulte Planejando um design de grupo de gerenciamento.

Agentes

Um agente do Operations Manager é um serviço instalado em um computador. O agente coleta dados, compara dados de amostra com valores predefinidos, cria alertas e executa respostas. Um servidor de gerenciamento recebe e distribui configurações para agentes em computadores monitorados.

Cada agente se reporta a um servidor de gerenciamento no grupo de gerenciamento. Este servidor de gerenciamento é especificado como o servidor de gerenciamento primário do agente.

Os agentes observam fontes de dados no computador monitorado e coletam informações de acordo com a configuração enviada a eles de seu servidor de gerenciamento. O agente também calcula o estado de integridade do computador monitorado e dos objetos e se reporta novamente ao servidor de gerenciamento. Quando o estado de integridade de um objeto monitorado é alterado ou outros critérios são atendidos, um alerta pode ser gerado pelo agente. Isto permite que os operadores descubram se há algo que requer atenção. Ao fornecer dados de integridade sobre o objeto monitorado ao servidor de gerenciamento, o agente fornece uma imagem atualizada da integridade do dispositivo e de todos os aplicativos que hospeda.

Um agente pode ser configurado para agir como um agente de proxy. Um agente de proxy é um agente que pode encaminhar dados para um servidor de gerenciamento em benefício de um computador ou dispositivo de rede, além do computador host. Por exemplo, um agente instalado no nó físico de um cluster SQL pode ser ativado para atuar como proxy para monitorar o recurso de cluster. Os agentes proxy permitem o monitoramento de computadores e dispositivos nos quais um agente não pode ser instalado. Para obter mais informações, consulte Agentless Monitoring (Monitoramento sem agente).

Serviços

Em um computador monitorado, o agente do Operations Manager é listado como o serviço Microsoft Monitoring Agent. O serviço Microsoft Monitoring Agent coleta dados de desempenho, executa tarefas e assim por diante. Mesmo quando o serviço é incapaz de se comunicar com o servidor de gerenciamento ao qual se reporta, o serviço continua a ser executado e coloca em fila os dados coletados e eventos no disco do computador monitorado. Quando a conexão é restaurada, o serviço Microsoft Monitoring Agent envia dados e eventos coletados para o servidor de gerenciamento.

Observação

O serviço Microsoft Monitoring Agent às vezes é chamado de Serviço de Integridade.

O serviço Microsoft Monitoring Agent também é executado em servidores de gerenciamento. Em um servidor de gerenciamento, o serviço executa fluxos de trabalho de monitoramento e gerencia credenciais. Para executar fluxos de trabalho, o serviço inicia MonitoringHost.exe processos usando credenciais especificadas. Estes processos monitoram e coletam dados de logs de eventos, dados do contador de desempenho, dados de Instrumentação de Gerenciamento do Windows (WMI), e executam ações, como scripts.

Os servidores de gerenciamento hospedam o serviço de Acesso a Dados do System Center e o serviço de Configuração de Gerenciamento do System Center.

O serviço de Acesso a Dados do System Center fornece acesso ao console de operações para o banco de dados operacional e grava dados para o banco de dados.

O serviço do System Center Management Configuration gerencia os relacionamentos e a topologia do grupo de gerenciamento. Ele também distribui os pacotes de gerenciamento para objetos monitorados.

Pacotes de gerenciamento

Os fluxos de trabalho que executam o serviço do System Center Management Configuration são definidos por pacotes de gerenciamento. Pacotes de gerenciamento definem as informações que o agente coleta e retorna ao servidor de gerenciamento para um aplicativo ou tecnologia específica. Por exemplo, o Pacote de Gerenciamento do BizTalk Server contém regras e monitores que coletam e avaliam eventos e operações que são importantes para assegurar a integridade e eficiência do aplicativo BizTalk Server.

Depois que o Operations Manager instala um agente em um computador, ele envia uma configuração inicial ao agente. A configuração inicial inclui descobertas de objeto de pacotes de gerenciamento. O pacote de gerenciamento define os tipos de objetos, como aplicativos e recursos que serão monitorados em computadores que foram descobertos pelo Operations Manager. Os agentes enviam dados ao servidor de gerenciamento, que identifica as instâncias de objetos descobertos no computador. O servidor de gerenciamento envia aos agentes os elementos dos pacotes de gerenciamento que se aplicam ao objetos descobertos para cada computador, como regras e monitores.

Uma regra define os eventos e os dados de desempenho a serem coletados dos computadores e o que fazer com as informações depois que elas são coletadas. Uma maneira simples de pensar sobre as regras é através de uma afirmação Se/Então. Por exemplo, um pacote de gerenciamento para um aplicativo pode conter regras como as seguintes:

  • Se uma mensagem indicando que o aplicativo está sendo desligado aparece no log de eventos, crie um alerta.

  • Se o upload de um arquivo de origem falhar, colete o evento que indica essa falha.

Como estes exemplos mostram, as regras podem criar alertas e coletar eventos ou dados de desempenho, que o agente envia ao servidor de gerenciamento. Regras também podem executar scripts; por exemplo, permitir que uma regra tente reiniciar um aplicativo com falha.

Objetos descobertos têm um estado de integridade, que é refletido no console de operações como verde (bem sucedido ou íntegro), amarelo (aviso) ou vermelho (crítico ou não íntegro). Monitores definem os estados de integridade para determinados aspectos do objeto monitorado. Por exemplo, um monitor para a capacidade da unidade de disco pode definir verde como menos de 85% cheio, amarelo como mais de 85% cheio e vermelho como mais de 90% cheio. Um monitor pode ser configurado para gerar um alerta quando ocorre uma mudança de estado.

Como os objetos são descobertos e monitorados

A imagem a seguir é uma ilustração simplificada de como os objetos são descobertos e monitorados.

Ilustração de uma visão geral de descoberta e monitoramento.

  1. O administrador configura o Operations Manager para procurar computadores para gerenciar. Para obter mais informações sobre como descobrir computadores, consulte Planejamento de implantação do agente.

  2. Os computadores que atendem aos critérios especificados e ainda não são gerenciados são identificados.

  3. Um agente do Operations Manager está instalado no computador descoberto.

  4. O agente solicita dados de configuração e, em seguida, o servidor de gerenciamento envia os dados de configuração do agente dos pacotes de gerenciamento instalados, que incluem as classes a serem descobertas. Por exemplo, se os pacotes de gerenciamento do sistema operacional Windows Server forem instalados, o servidor de gerenciamento enviará ao agente as classes do sistema operacional.

  5. O agente compara os dados de configuração ao computador, identifica objetos que descobre e retorna as informações ao servidor de gerenciamento. Por exemplo, o agente informará ao serviço de gerenciamento que há uma instância do sistema operacional Windows Server 2019 no computador.

  6. O servidor de gerenciamento envia ao agente toda a lógica de monitoramento dos pacotes de gerenciamento instalados que se aplica aos objetos descobertos. Por exemplo, o agente receberá toda a lógica de monitoramento que se aplica ao Windows Server 2019.

  7. O agente aplica a lógica de monitoramento, como regras e monitores, executa fluxos de trabalho e retorna dados ao servidor de gerenciamento.

  8. À medida que ocorrem alterações em objetos descobertos, como aplicativos que estão sendo adicionados ou desinstalados, o agente envia as informações atualizadas para o servidor de gerenciamento, que envia a lógica de monitoramento atualizada.

Observação

O Operations Manager também pode descobrir e monitorar dispositivos de rede, computadores que executam sistemas operacionais UNIX e Linux e fornecer monitoramento sem agente. Para obter mais informações, consulte Operations Manager Monitoring Scenarios (Cenários de monitoramento do Operations Manager) no Guia de Operações.

Communication between agents and management servers

O agente do Operations Manager envia dados de alerta e descoberta ao servidor de gerenciamento primário, que sobrescrevem os dados do banco de dados operacional. O agente também envia dados de eventos, desempenho e estado ao servidor de gerenciamento primário para esse agente, que sobrescrevem os dados para o banco de dados operacional e data warehouse simultaneamente.

O agente envia dados de acordo com os parâmetros de agendamento para cada regra e monitor. Para regras de coleta otimizada, os dados somente serão transmitidos se uma amostra de um contador diferir da amostra anterior por uma tolerância especificada, como 10%. Isto ajuda a reduzir o tráfego de rede e o volume de dados armazenados no banco de dados operacional.

Além disso, todos os agentes enviam um pacote de dados, chamado de uma pulsação, para o servidor de gerenciamento em um agendamento regular, por padrão a cada 60 segundos. A finalidade da pulsação é validar a disponibilidade do agente e comunicação entre o agente e o servidor de gerenciamento. Para obter mais informações sobre pulsações, consulte How Heartbeats Work in Operations Manager (Como as pulsações funcionam no Operations Manager).

Para cada agente, o Operations Manager executa um inspetor do serviço de integridade, que monitora o estado do Serviço de integridade remoto do ponto de vista do servidor de gerenciamento.

Outros recursos do Operations Manager