Monitorizar o Site Recovery

Neste artigo, saiba como monitorar o Azure Site Recovery, usando o monitoramento interno do Site Recovery. Pode monitorizar:

  • A integridade e o status das máquinas replicadas pelo Site Recovery
  • Teste o status de failover das máquinas.
  • Problemas e erros que afetam a configuração e a replicação.
  • Componentes de infraestrutura, como servidores locais.

Antes de começar

Talvez você queira revisar perguntas comuns de monitoramento antes de começar.

Monitor no painel

  1. No cofre, selecione Visão geral. O painel dos Serviços de Recuperação consolida todas as informações de monitoramento do cofre em um único local. Há páginas para o Site Recovery e o serviço de Backup do Azure, e você pode alternar entre elas.

    A captura de tela exibe o painel do Site Recovery.

  2. A partir do painel de instrumentos, faça uma busca detalhada em diferentes áreas.

    A captura de tela exibe as áreas no painel onde você pode detalhar.

  3. Em Itens replicados, selecione Exibir tudo para ver todos os servidores no cofre.

  4. Selecione os detalhes de status em cada seção para detalhar.

  5. No modo de exibição Infraestrutura, classifique as informações de monitoramento pelo tipo de máquinas que você está replicando.

Monitorar itens replicados

Em Itens replicados, monitore a integridade de todas as máquinas no cofre que têm a replicação habilitada.

Distrito Detalhes
Bom estado de funcionamento A replicação está progredindo normalmente. Nenhum erro ou sintomas de alerta são detetados.
Aviso Um ou mais sintomas de alerta que podem afetar a replicação são detetados.
Crítico Um ou mais sintomas críticos de erro de replicação foram detetados.

Esses sintomas de erro geralmente são indicadores de que a replicação travou ou não progrediu tão rápido quanto a taxa de alteração de dados.
Não aplicável Servidores que atualmente não devem ser replicados. Isso pode incluir máquinas que foram submetidas a failover.

Monitorar failovers de teste

Em Teste de failover bem-sucedido, monitore o status de failover das máquinas no cofre.

  • Recomendamos que você execute um failover de teste em máquinas replicadas pelo menos uma vez a cada seis meses. É uma maneira de verificar se o failover está funcionando conforme o esperado, sem interromper o ambiente de produção.
  • Um failover de teste é considerado bem-sucedido somente depois que o failover e a limpeza pós-failover forem concluídos com êxito.
Distrito Detalhes
Teste recomendado Máquinas que não tiveram um failover de teste desde que a proteção foi ativada.
Executado com êxito Máquinas com ou com failovers de teste mais bem-sucedidos.
Não aplicável Máquinas que atualmente não estão qualificadas para um failover de teste. Por exemplo, máquinas com failover têm replicação/failover de teste/failover inicial em andamento.

Monitorar problemas de configuração

Em Problemas de configuração, monitore quaisquer problemas que possam afetar sua capacidade de failover bem-sucedido.

  • Problemas de configuração (exceto a disponibilidade de atualização de software) são detetados por uma operação de validação periódica que é executada a cada 12 horas por padrão. Você pode forçar a operação do validador a ser executada imediatamente selecionando o ícone de atualização ao lado do cabeçalho da seção Problemas de configuração.
  • Selecione os links para obter mais detalhes. Para problemas que afetam máquinas específicas, selecione as necessidades de atenção na coluna Configurações de destino. Os detalhes incluem recomendações de remediação.
Distrito Detalhes
Configurações ausentes Uma configuração necessária está faltando, como uma rede de recuperação ou um grupo de recursos.
Recursos em falta Um recurso especificado não pode ser encontrado ou não está disponível na assinatura. Por exemplo, o recurso foi excluído ou migrado. Os recursos monitorados incluíam o grupo de recursos de destino, a rede virtual/sub-rede de destino, a conta de armazenamento de log/destino, o conjunto de disponibilidade de destino, o endereço IP de destino.
Quota de subscrição O saldo de cota de recursos de assinatura disponível é comparado com o saldo necessário para fazer failover de todas as máquinas no cofre.

Se não houver recursos suficientes, um saldo de cota insuficiente é relatado.

As cotas estão monitorando a contagem de núcleos de VM, a contagem de núcleos da família de VMs, a contagem de placas de interface de rede (NIC).
Atualizações de software A disponibilidade de novas atualizações de software e informações sobre versões de software que expiram.

Monitorizar erros

Em Resumo de erros, monitore os sintomas de erro atualmente ativos que podem afetar a replicação de servidores no cofre e monitore o número de máquinas afetadas.

  • Os erros que afetam os componentes de infraestrutura local são mostrados no início da seção. Por exemplo, o não recebimento de uma pulsação do Provedor de Recuperação de Site do Azure no servidor de configuração local ou no host Hyper-V.
  • Em seguida, os sintomas de erro de replicação que afetam os servidores replicados são mostrados.
  • As entradas da tabela são classificadas por ordem decrescente da gravidade do erro e, em seguida, por ordem decrescente de contagem das máquinas afetadas.
  • A contagem de servidores afetados é uma maneira útil de entender se um único problema subjacente pode afetar várias máquinas. Por exemplo, uma falha de rede pode potencialmente afetar todas as máquinas que replicam para o Azure.
  • Vários erros de replicação podem ocorrer em um único servidor. Nesse caso, cada sintoma de erro conta esse servidor na lista de seus servidores afetados. Depois que o problema é corrigido, os parâmetros de replicação melhoram e o erro é eliminado da máquina.

Monitore a infraestrutura.

No modo de exibição Infraestrutura, monitore os componentes de infraestrutura envolvidos na replicação e a integridade da conectividade entre os servidores e os serviços do Azure.

  • Uma linha verde indica que a conexão está íntegra.

  • Uma linha vermelha com o ícone de erro sobreposto indica a existência de um ou mais sintomas de erro que afetam a conectividade.

  • Passe o ponteiro do mouse sobre o ícone de erro para mostrar o erro e o número de entidades afetadas e selecione o ícone para uma lista filtrada de entidades afetadas.

    A captura de tela exibe a exibição da infraestrutura de Recuperação de Site (vault).

Dicas para monitorar a infraestrutura

  • Verifique se os componentes de infraestrutura local (servidor de configuração, servidores de processo, servidores VMM, hosts Hyper-V, máquinas VMware) estão executando as versões mais recentes do Site Recovery Provider e/ou agentes.

  • Para usar todos os recursos na visualização de infraestrutura, você deve estar executando o pacote cumulativo de atualizações 22 para esses componentes.

  • Para usar a exibição de infraestrutura, selecione o cenário de replicação apropriado em seu ambiente. Você pode detalhar a exibição para obter mais detalhes. A tabela a seguir mostra quais cenários são representados.

    Cenário Distrito Ver disponível?
    Replicação entre locais Todos os estados Não
    Replicação de VM do Azure entre regiões do Azure Replicação habilitada/replicação inicial em andamento Sim
    Replicação de VM do Azure entre regiões do Azure Failover/failback Não
    Replicação VMware para o Azure Replicação habilitada/replicação inicial em andamento Sim
    Replicação VMware para o Azure Failover/failed back Não
    Replicação do Hyper-V para o Azure Failover/failed back Não
  • Para ver a visualização de infraestrutura de uma única máquina replicante, no menu do vault, selecione Itens replicados e selecione um servidor.

Monitorizar os planos de recuperação

Em Planos de recuperação, monitore o número de planos, crie novos planos e modifique os existentes.

Monitorizar trabalhos

Em Trabalhos, monitore o status das operações de Recuperação de Site.

  • A maioria das operações no Azure Site Recovery é executada de forma assíncrona, com um trabalho de controle sendo criado e usado para acompanhar o progresso da operação.
  • O objeto de trabalho tem todas as informações necessárias para acompanhar o estado e o progresso da operação.

Monitore os trabalhos da seguinte maneira:

  1. Na seção Trabalhos do painel>, você pode ver um resumo dos trabalhos concluídos, em andamento ou aguardando entrada nas últimas 24 horas. Você pode selecionar em qualquer estado para obter mais informações sobre os trabalhos relevantes.

  2. Selecione Ver tudo para ver todos os trabalhos nas últimas 24 horas.

    Nota

    Você também pode acessar informações de trabalho no menu >do cofre Site Recovery Jobs.

  3. Na lista Trabalhos de Recuperação de Site, uma lista de trabalhos é exibida. No menu superior, você pode obter detalhes de erro para um trabalho específico, filtrar a lista de trabalhos com base em critérios específicos e exportar detalhes do trabalho selecionado para o Excel.

  4. Você pode detalhar um trabalho selecionando-o.

Monitorizar máquinas virtuais

  1. Em Itens replicados, obtenha uma lista de máquinas replicadas.

    A captura de tela exibe o modo de exibição de lista de itens replicados do Site Recovery.

  2. Você pode visualizar e filtrar informações. No menu de ações na parte superior, você pode executar ações para uma máquina específica, incluindo a execução de um failover de teste ou a visualização de erros específicos.

  3. Selecione Colunas para mostrar colunas adicionais, Por exemplo, para mostrar RPO, problemas de configuração de destino e erros de replicação.

  4. Selecione Filtrar para exibir informações com base em parâmetros específicos, como a integridade da replicação ou uma política de replicação específica.

  5. Selecione uma máquina para iniciar operações como failover de teste para ela ou para exibir detalhes de erro específicos associados a ela.

  6. Selecione uma máquina para obter mais detalhes sobre ela. Os detalhes incluem:

    • Informações de replicação: status atual e integridade da máquina.
    • RPO (Recovery Point Objetive): RPO atual para a máquina virtual e a hora em que o RPO foi calculado pela última vez.
    • Pontos de recuperação: os últimos pontos de recuperação disponíveis para a máquina.
    • Prontidão para failover: indica se um failover de teste foi executado para a máquina, a versão do agente em execução na máquina (para máquinas que executam o serviço de mobilidade) e quaisquer problemas de configuração.
    • Erros: Lista de sintomas de erro de replicação atualmente observados na máquina e possíveis causas/ações.
    • Eventos: Uma lista cronológica de eventos recentes que afetam a máquina. Os detalhes do erro mostram os sintomas de erro atualmente observáveis, enquanto os eventos são um registro histórico de problemas que afetaram a máquina.
    • Modo de exibição de infraestrutura: mostra o estado da infraestrutura para o cenário quando as máquinas estão replicando para o Azure.

    A captura de tela exibe o modo de exibição de lista de itens de máquinas virtuais do Site Recovery.

Inscrever-se para receber notificações por e-mail

Você pode se inscrever para receber notificações por e-mail para estes eventos críticos:

  • Estado crítico para máquina replicada.
  • Não há conectividade entre os componentes de infraestrutura local e o serviço de Recuperação de Site. A conectividade entre a Recuperação de Site e os servidores locais registrados em um cofre é detetada usando um mecanismo de pulsação.
  • Falhas de failover.

Subscreva da seguinte forma:

Na seção Monitoramento do cofre>, selecione Eventos de recuperação de site.

  1. Selecione Notificações por e-mail.

  2. Em Notificação por e-mail, ative as notificações e especifique para quem enviar. Você pode enviar a todos os administradores de assinatura receber notificações e, opcionalmente, endereços de e-mail específicos.

    A captura de tela exibe o modo de exibição Notificações por e-mail.

Alertas internos do Azure Monitor para o Azure Site Recovery (visualização)

O Azure Site Recovery também fornece alertas padrão por meio do Azure Monitor, que permite que você tenha uma experiência consistente para gerenciamento de alertas em diferentes serviços do Azure. Com os alertas baseados no Azure Monitor, pode rotear alertas para qualquer canal de notificação suportado pelo Azure Monitor, como email, Webhook, aplicativo lógico e muito mais. Também pode usar outros recursos de gestão de alertas oferecidos pelo Azure Monitor, por exemplo, ao suprimir notificações durante uma janela de manutenção planeada.

Habilitar alertas internos do Azure Monitor

Para habilitar alertas internos do Azure Monitor para o Azure Site Recovery, para uma assinatura específica, navegue até Visualizar Recursos no portal do Azure e registre o sinalizador de recurso EnableAzureSiteRecoveryAlertsToAzureMonitor para a assinatura selecionada.

Nota

  • Recomendamos que você aguarde 24 horas para que o registro entre em vigor antes de testar o recurso.
  • Se o cofre dos Serviços de Recuperação for criado antes de a subscrição ser registada, a subscrição deverá ser novamente registada.

A captura de tela exibe o sinalizador do recurso para se registrar para o recurso de alerta.

Cenários de alertas

Depois de registar este recurso, o Azure Site Recovery envia um alerta padrão (exibido através do Azure Monitor) sempre que ocorrer algum dos seguintes eventos críticos:

  • Habilite alertas de falha de recuperação de desastres para replicação de VM, Hyper-V e VMware do Azure.
  • Alertas críticos de integridade de replicação para replicação de VM do Azure, Hyper-V e VMware.
  • Alertas de expiração da versão do agente do Azure Site Recovery para replicação de VM do Azure e Hyper-V.
  • Alertas não acessíveis do agente do Azure Site Recovery para replicação do Hyper-V.
  • Alertas de falha de failover para replicação de VM do Azure, Hyper-V e VMware.
  • Alertas de expiração de certificação automática para replicação de VM do Azure.

Para testar o funcionamento dos alertas para uma VM de teste usando o Azure Site Recovery, você pode desabilitar o acesso à rede pública para a conta de armazenamento em cache para que um alerta de Integridade da Replicação transformado em crítico seja gerado. Os alertas são gerados por padrão, sem qualquer necessidade de configuração de regras. No entanto, para habilitar notificações (por exemplo, notificações por e-mail) para esses alertas gerados, você deve criar uma regra de processamento de alertas, conforme descrito nas seções a seguir.

Exibir os alertas gerados do Azure Site Recovery no Azure Monitor

Depois que os alertas forem gerados, poderá exibi-los e geri-los no portal do Azure Monitor. Siga estes passos:

  1. No portal do Azure, vá para Alertas do Azure Monitor>.
  2. Defina o filtro para o Monitor Service = Azure Site Recovery para ver alertas específicos do Azure Site Recovery. Também pode personalizar os valores de outros filtros para ver alertas de um intervalo de tempo específico até 30 dias ou para cofres, subscrições, gravidade e estado do alerta (resposta do utilizador).
  3. Selecione qualquer alerta do seu interesse para ver mais detalhes. Por exemplo, a VM afetada, possíveis causas, ação recomendada, etc.
  4. Depois que o evento for atenuado, você poderá modificar seu estado para Fechado ou Reconhecido.

A captura de ecrã apresenta alertas de Visualização através do Azure Monitor no portal.

Exibir os alertas gerados do Azure Site Recovery no vault dos Serviços de Recuperação

Siga estas etapas para visualizar os alertas gerados para um vault específico através da experiência do cofre:

  1. No portal do Azure, vá para o cofre dos Serviços de Recuperação que você está usando.
  2. Selecione a seção Alertas e filtre o Monitor Service = Azure Site Recovery para ver alertas específicos do Azure Site Recovery. Pode personalizar os valores dos outros filtros para ver alertas de um intervalo de tempo específico de até 30 dias, para cofres, assinaturas, gravidade e estado de alerta (resposta do usuário).
  3. Selecione qualquer alerta de seu interesse para ver mais detalhes, como a VM afetada, possíveis causas, ação recomendada, etc.
  4. Depois que o evento for atenuado, você poderá modificar seu estado para Fechado ou Reconhecido.

A captura de tela exibe alertas por meio do cofre dos Serviços de Recuperação no portal.

Configurar notificações por e-mail para alertas

Para configurar notificações por email para alertas internos do Azure Monitor para o Azure Site Recovery, você deve criar uma regra de processamento de alertas no Azure Monitor. A regra de processamento de alertas especificará quais alertas devem ser enviados para um canal de notificação específico (grupo de ações).

Siga estas etapas para criar uma regra de processamento de alerta:

  1. Vá para Alertas do Azure Monitor>e selecione Regras de processamento de alertas no painel superior.

    A captura de tela exibe a opção de regras de processamento de alertas no Azure Monitor.

  2. Selecione Criar.

    A captura de tela exibe a criação de uma nova regra de processamento de alerta.

  3. Em Escopo>Selecione o escopo da regra de processamento de alertas, você pode aplicar a regra para todos os recursos de uma assinatura. Outras personalizações podem ser feitas no escopo aplicando filtros. Por exemplo, gerar notificação para alerta de uma determinada gravidade.

    A captura de tela exibe o escopo selecionado para a regra de processamento de alerta.

  4. Em Configurações de regra, selecione Aplicar grupo de ações e Criar grupo de ações (ou use um existente). É o destino para o qual deve ser enviada a notificação de alerta. Por exemplo, um endereço de e-mail.

    A captura de tela exibe a opção Criar novo grupo de ações.

  5. Para a criação de um grupo de ações, na guia Noções básicas , selecione o nome do grupo de ações, a assinatura e o grupo de recursos sob o qual ele deve ser criado.

    A captura de tela exibe Configurar notificações criando um grupo de ações.

  6. Na guia Notificações, selecione o destino da notificação E-mail/Mensagem SMS/Push/Voz e insira o ID de e-mail do destinatário e outros detalhes, conforme necessário.

    A captura de tela exibe a opção selecionar canal de notificação necessário.

  7. Selecione Revisão+Criar>Criar para implantar o grupo de ações. A criação do grupo de ações leva você de volta à criação da regra de processamento de alertas.

    Nota

    O grupo de ações criado aparece na página Configurações da regra .

  8. Na guia Agendamento, selecione Sempre.

    A captura de tela exibe as opções de agendamento para a regra de processamento de alertas.

  9. Na guia Detalhes, especifique a assinatura, o grupo de recursos e o nome da regra de processamento de alertas que está sendo criada.

    A captura de tela exibe Salvar a regra de processamento de alertas em qualquer assinatura.

  10. Adicione etiquetas, se necessário, e selecione Rever+Criar>criação. A regra de processamento de alertas estará ativa em alguns minutos.

Configurar notificações para canais que não são de e-mail

Com os grupos de ação do Azure Monitor, você pode rotear alertas para outros canais de notificação, como webhooks, aplicativos lógicos, funções, etc. Saiba mais sobre grupos de ação com suporte no Azure Monitor.

Configurar notificações através de interfaces programáticas

Pode utilizar as seguintes interfaces suportadas pelo Azure Monitor para gerir grupos de ação e regras de processamento de alertas:

Suprimir notificações durante uma janela de manutenção planejada

Pode haver cenários, como janelas de manutenção, durante os quais se espera que as operações do Azure Site Recovery falhem. Se você tiver um requisito para suprimir notificações durante esses períodos, poderá configurar uma regra de processamento de alerta de supressão para ser executada por um período específico.

Para criar uma regra de processamento de alerta de supressão, use o mesmo processo seguido para criar uma regra de processamento de alerta baseada em notificação descrita na seção anterior, com as seguintes diferenças:

  1. Em Configurações da regra, selecione Suprimir notificações. Se houver uma regra de processamento de alerta de supressão e uma regra de processamento de alerta de grupo de ações aplicada no mesmo escopo, a regra de supressão terá precedência.

    A captura de tela exibe Ativar supressão de notificação.

  2. Em Agendamento, insira a janela de tempo para a qual você deseja que os alertas sejam suprimidos.

    A captura de tela exibe a janela Agendar tempo para supressão de notificação.

Preços

Com alertas internos do Azure Monitor, os alertas para operações críticas ou falhas são gerados por padrão. Pode visualizar estes alertas no portal ou através de interfaces fora do portal sem custos adicionais. No entanto, para encaminhar esses alertas para um canal de notificação (como e-mail), você incorre em um custo menor para notificações além do nível gratuito (de 1000 e-mails por mês). Saiba mais sobre os preços do Azure Monitor.

Próximos passos

Saiba mais sobre como monitorar o Site Recovery com o Azure Monitor.