Monitorar alertas e integridade no Azure Stack – Data Center Modular (MDC)

O Azure Stack inclui recursos de monitoramento de infraestrutura que ajudam você a exibir a integridade e alertas para uma região do Azure Stack. O bloco de gerenciamento de região lista todas as regiões implantadas do Azure Stack. Ele é fixado por padrão no portal do administrador para a Assinatura do Provedor Padrão. O bloco mostra o número de alertas críticos e de avisos ativos para cada região. O bloco é o ponto de entrada na funcionalidade de integridade e alerta do Azure Stack.

The Region Management tile in Azure Stack administrator portal

Entender a integridade no Azure Stack

O provedor de recursos de integridade gerencia os alertas e a integridade. Os componentes de infraestrutura do Azure Stack registram-se no provedor de recursos de integridade durante a implantação e a configuração do Azure Stack. Esse registro permite a exibição de alertas e de integridade de cada componente. A integridade no Azure Stack é um conceito simples. Se existirem alertas para uma instância registrada de um componente, o estado de integridade desse componente refletirá a pior severidade do alerta ativo: aviso ou crítico.

Definição de severidade do alerta

O Azure Stack gera alertas com apenas duas gravidades: aviso e crítica.

  • Aviso
    Um operador pode resolver o alerta de aviso de maneira agendada. O alerta normalmente não afeta as cargas de trabalho do usuário.

  • Crítico
    Um operador deve abordar o alerta crítico com urgência. Esses alertas indicam problemas que afetam ou afetarão em breve os usuários do Azure Stack.

Exibir e gerenciar o estado de integridade do componente

Você pode exibir o estado de integridade dos componentes no portal do administrador e por meio da API REST e do PowerShell.

Para exibir o estado de integridade no portal, clique na região que você deseja exibir no bloco Gerenciamento de Região. Você pode exibir o estado de integridade das funções de infraestrutura e dos provedores de recursos.

List of infrastructure roles

Você pode clicar em um provedor de recursos ou função de infraestrutura para exibir informações mais detalhadas.

Aviso

Se você clicar em uma função de infraestrutura e clicar na instância de função, haverá opções para Iniciar, Reiniciar ou Desligar. Não use essas ações quando aplicar atualizações a um sistema integrado. Para solucionar problemas de assistência, poste seu problema no fórum do Azure Stack.

Exibir alertas

A lista de alertas ativos para cada região do Azure Stack está disponível diretamente na folha gerenciamento de região . O primeiro bloco na configuração padrão é o de Alertas, que exibe um resumo dos alertas críticos e de aviso para a região. Você pode fixar o bloco de Alertas, como qualquer outro bloco nessa folha, no painel para acesso rápido.

Alerts tile that shows a warning in Azure Stack administrator portal

Para exibir uma lista de todos os alertas ativos da região, selecione a parte superior do bloco Alertas. Para exibir uma lista filtrada de alertas (Crítico ou Aviso), selecione o item de linha Crítico ou Aviso dentro do bloco.

A folha Alertas dá suporte à capacidade de filtrar o estado (ativo ou fechado) e a gravidade (crítico ou aviso). A exibição padrão apresenta todos os alertas ativos. Todos os alertas fechados são removidos do sistema após sete dias.

Observação

Se um alerta permanecer ativo, mas não tiver sido atualizado em mais de um dia, você poderá executar o Test-AzureStack e fechar o alerta se nenhum problema for relatado.

Filter pane to filter by critical or warning status in Azure Stack administrator portal

A ação Exibir API apresenta a API REST que foi usada para gerar a exibição da lista. Essa ação fornece uma maneira rápida de se familiarizar com a sintaxe da API REST que você pode usar para consultar alertas. Você pode usar essa API na automação ou para integração com suas soluções existentes de monitoramento, relatórios e tíquetes do datacenter.

Você pode clicar em um alerta específico para exibir os detalhes do alerta. Os detalhes do alerta mostram todos os campos associados ao alerta e permitem a navegação rápida para o componente afetado e a origem do alerta. Por exemplo, o alerta a seguir ocorrerá se uma das instâncias de função da infraestrutura ficar offline ou não estiver acessível. Você pode pesquisar o link de referência cruzada na seção Correção dos detalhes do alerta para exibir o artigo.

The Alert details blade in Azure Stack administrator portal

Reparar alertas

Você pode selecionar Reparar em alguns alertas.

Quando selecionada, a ação Reparar executa etapas específicas do alerta para tentar resolver o problema. Depois de selecionado, o status da ação De reparo está disponível como uma notificação do portal.

The Repair alert action in progress

A ação Reparar relatará conclusão bem-sucedida ou falha ao concluir a ação na mesma folha de notificação do portal. Se uma ação de reparo falhar para um alerta, você poderá executar novamente a ação Reparar a partir dos detalhes do alerta. Se a ação Reparar for concluída com êxito, não execute novamente a ação Reparar .

The Repair action completes successfully

Depois que a instância da função de infraestrutura estiver novamente online, esse alerta será fechado automaticamente. Muitos, mas não todos os alertas, fecham automaticamente quando o problema subjacente é resolvido. Os alertas que fornecem um botão de ação de reparo serão fechados automaticamente se o Azure Stack resolver o problema. Para todos os outros alertas, selecione Fechar Alerta depois de executar as etapas de correção. Se o problema persistir, o Azure Stack gerará um novo alerta. Se você resolver o problema, o alerta permanecerá fechado e não exigirá mais etapas.

Próximas etapas

Gerenciar atualizações no Azure Stack

Gerenciamento de região no Azure Stack