Observabilidade do Azure Operator Nexus

A estrutura de observabilidade do Operator Nexus fornece informações operacionais sobre suas instâncias locais. A estrutura suporta registro, monitoramento e alertas (LMA), análise e visualização de dados e métricas operacionais (plataforma e cargas de trabalho).

Screenshot of Operator Nexus Logging, Monitoring and Alerting (LMA) Framework.

Figura: Estrutura de Logging, Monitoramento e Alerta (LMA) do Operator Nexus

Os principais destaques da estrutura de observabilidade do Operator Nexus são:

  • Coleta centralizada de dados: A solução de observabilidade Nexus do operador é baseada em uma coleta de todos os dados em um local central. Neste local, você pode observar os dados de monitoramento de todas as suas instâncias locais.
  • Ferramentas bem definidas e testadas: a solução depende do Azure Monitor que coleta, analisa e atua em dados de telemetria de suas instâncias locais e na nuvem.
  • Fácil de aprender e usar: a solução facilita a análise e a depuração de problemas com a capacidade de pesquisar os dados de dentro ou em todas as suas instâncias locais e na nuvem.
  • Ferramentas de visualização: você cria painéis e pastas de trabalho personalizados de acordo com suas necessidades.
  • Ferramentas de alerta integradas: você cria alertas com base em limites personalizados. Você pode criar e reutilizar modelos de alerta em todas as instâncias.

Este artigo ajuda você a entender a estrutura de observabilidade do Operator Nexus que consiste em uma pilha de componentes:

  • O Azure Monitor coleta e agrega dados de log dos componentes do Operator Nexus
  • O Azure Log Analytics Workspace (LAW) recolhe e agrega dados de registo de várias subscrições e inquilinos do Azure
  • Análise, visualização e alertas são realizados nos dados de log agregados.

Monitorização da Plataforma

O Operator Nexus oferece visibilidade sobre o desempenho de suas implantações que consistem em recursos de infraestrutura. Você precisa que os logs e métricas sejam coletados e analisados a partir desses recursos da plataforma. Você obtém informações valiosas da coleta centralizada e da agregação de dados de todas as fontes, em comparação com dados desagregados.

Esses logs e métricas são usados para observar o estado da plataforma. Você pode ver o desempenho e analisar o que está errado. Você pode analisar o que causou a situação. A visualização ajuda a configurar os alertas necessários e em que condições. Por exemplo, você pode configurar os alertas a serem gerados quando os recursos estiverem se comportando de forma anormal ou quando os limites forem atingidos. Você pode usar os logs e análises coletados para depurar quaisquer problemas no ambiente.

Dados de monitorização

A observabilidade do Operator Nexus permite que você colete o mesmo tipo de dados que outros recursos do Azure. Os dados recolhidos de cada uma das suas instâncias podem ser visualizados na sua LEI.

Você pode aprender sobre o monitoramento de recursos do Azure aqui.

Recolha e encaminhamento

A observabilidade do Operator Nexus permite coletar dados para cada recurso de infraestrutura. O conjunto de componentes da infraestrutura inclui:

  • Malha de rede que inclui CEs, TORs, NPBs, switches de gerenciamento e o servidor de terminal.
  • Computação que inclui servidores bare metal.
  • Undercloud Control Plane (cluster Kubernetes responsável pela implantação e gerenciamento do ciclo de vida da plataforma global).

A coleta de dados de log dessas camadas é habilitada por padrão durante a criação da instância do Operator Nexus. Esses logs coletados são roteados para o Azure Monitor LAW.

Você também pode coletar dados das camadas de locatário criadas para executar funções de rede em contêineres e virtualizadas. Os dados de log que podem ser coletados incluem:

  • Coleta de syslog de máquinas virtuais (usado para cargas de trabalho VNFs ou CNF).
  • Coleta de logs de clusters Kubernetes e dos aplicativos implantados na parte superior.

Você precisará habilitar a coleta dos logs dos clusters Kubernetes e Máquinas Virtuais do locatário. Você deve seguir as etapas para implantar os agentes de monitoramento do Azure. Os dados seriam coletados em seu Azure LAW.

Armazenamento do Nexus Logs do operador

Os dados nos Logs do Azure Monitor são armazenados em tabelas onde cada tabela tem seu próprio conjunto de propriedades exclusivas.

Todos os logs de recursos no Azure Monitor têm os mesmos campos seguidos por campos específicos do serviço; veja o esquema comum.

Os logs da plataforma Operator Nexus são armazenados nas seguintes tabelas:

Table Descrição
Syslog Eventos Syslog em computadores Linux usando o agente do Log Analytics
ContainerInventory Detalhes e estado atual de cada contêiner.
ContainerLog Linhas de log coletadas de fluxos stdout e stderr para contêineres
ContainerNodeInventory Detalhes dos nós que servem como hosts de contêiner.
InsightMetrics Métricas coletadas de Server, K8s, Containers.
KubeEvents Eventos do Kubernetes e suas propriedades.
KubeMonAgentEventos Eventos registrados pelo agente Kubernetes do Azure Monitor para erros e avisos.
KubeNodeInventory Detalhes para nós que fazem parte do cluster do Kubernetes
KubePodInventory Pods Kubernetes e suas propriedades
KubePVInventory Volumes persistentes do Kubernetes e suas propriedades.
KubeServices Serviços Kubernetes e suas propriedades
Heartbeat Registros registrados pelos agentes do Log Analytics uma vez por minuto para relatar a integridade do agente

Métricas de nexo do operador

A tabela 'InsightMetrics' na seção Logs contém as métricas coletadas de máquinas bare metal e do cluster Kubernetes abaixo da nuvem. Além disso, algumas métricas selecionadas coletadas da subnuvem podem ser observadas abrindo a guia Métricas no menu Azure Monitor.

Screenshot of Azure Monitor Metrics Selection.

Figura: Seleção de métricas do Azure Monitor

Consulte Analisar métricas com o explorador de métricas do Azure Monitor para obter detalhes sobre como usar essa ferramenta.

Livros

As pastas de trabalho combinam texto, consultas de log, métricas e parâmetros para análise de dados e a criação de vários tipos de visualizações avançadas. Você pode usar os modelos de pasta de trabalho de exemplo do Azure Resource Manager para Log e Monitoramento do Operator Nexus para implantar Pastas de Trabalho do Azure em seu Azure LAW.

Alertas

Você pode usar os modelos de alarme de exemplo do Azure Resource Manager para regras de alerta do Operator Nexus. Você deve especificar limites e condições para os alertas. Em seguida, você pode implantar esses modelos de alerta em seu ambiente local.

Espaço de trabalho analítico de log

Um Espaço de Trabalho do Log Analytics (LAW) é um ambiente exclusivo para registrar dados do Azure Monitor e de outros serviços do Azure. Cada espaço de trabalho tem seu próprio repositório de dados e configuração, mas pode combinar dados de vários serviços. Cada espaço de trabalho consiste em várias tabelas de dados.

Uma única LEI pode ser criada para coletar todos os dados relevantes ou vários espaços de trabalho com base nos requisitos do operador.