Compartilhar via


Procedimento de failover de recuperação de desastre

Importante

Este artigo não substitui a documentação de administração do SAP HANA ou as Notas do SAP. Esperamos que você tenha uma compreensão sólida e experiência com administração e operações em SAP HANA, especialmente para backup, restauração, alta disponibilidade e recuperação de desastres (DR). Neste artigo, são mostradas capturas de tela do SAP HANA Studio. O conteúdo, a estrutura e a natureza das telas das ferramentas de administração do SAP e as próprias ferramentas podem mudar de uma versão do SAP HANA para outra versão.

Neste artigo, veremos as etapas de failover de um site de DR para o SAP HANA em Instâncias Grandes do Azure (também conhecido como Infraestrutura Bare Metal).

Cenários e opções de failover

Há dois casos a serem considerados ao fazer failover para um site de recuperação de desastre:

  • É necessário que o banco de dados do SAP HANA retorne para o status mais recente dos dados. Nesse caso, há um script de autoatendimento que você pode usar para fazer o failover sem precisar entrar em contato com a Microsoft. Para o failback, você precisa trabalhar com a Microsoft.
  • Sua intenção é restaurar para um instantâneo de armazenamento que não seja o último instantâneo replicado. Nesse caso, você precisa trabalhar com a Microsoft.

Observação

As etapas a seguir precisam ser executadas no HANA em Instância Grande no site de DR.

Para restaurar os instantâneos de armazenamento replicados mais recentemente, siga as etapas em “Executar failover de recuperação de desastre completo - azure_hana_dr_failover” em Ferramentas de instantâneos da Microsoft para SAP HANA no Azure.

Se você quiser que várias instâncias do SAP HANA façam failover, execute o comando azure_hana_dr_failover várias vezes. Quando solicitado, insira o SID do SAP HANA que você deseja fazer failover e restaurar.

Teste o failover de DR sem afetar a relação de replicação real. Para fazer um failover de teste, siga as etapas descritas em "Fazer um failover de teste de DR – azure_hana_test_dr_failover" em Ferramentas de instantâneo da Microsoft para o SAP HANA no Azure.

Importante

Não execute nenhuma transação na instância que você criou no site de recuperação de desastre por meio do processo de teste de um failover. O comando azure_hana_test_dr_failover cria um conjunto de volumes que não têm nenhuma relação com o site primário. Como resultado, a sincronização de volta para o site primário não é possível.

Caso deseje testar várias instâncias do SAP HANA, execute o script várias vezes. Quando solicitado, insira o SID do SAP HANA da instância que você deseja testar para fazer failover.

Definir os volumes de DR para um instantâneo mais antigo

Digamos que você precise fazer failover para o site de DR a fim de resgatar alguns dados que foram excluídos há algumas horas e precise que os volumes de DR sejam definidos como um instantâneo mais antigo. Nesse caso, o seguinte procedimento se aplica:

  1. Desligue a instância de não produção do HANA no SAP HANA de DR em Instâncias Grandes que está sendo executada. Uma instância de produção inativa do HANA é pré-instalada.

  2. Certifique-se de que não há nenhum processo do SAP HANA em execução. Use o comando a seguir para essa verificação:

    /usr/sap/hostctrl/exe/sapcontrol –nr <HANA instance number> - function GetProcessList.

    A saída agora deve mostrar o processo hdbdaemon em um estado interrompido e nenhum outro processo do HANA em estado de execução ou iniciado.

  3. Determine para qual nome de instantâneo ou ID de backup do SAP HANA você deseja ter a recuperação de desastre restaurada. Em casos de recuperação de desastres reais, esse instantâneo é geralmente o instantâneo mais recente. Se você precisar recuperar dados perdidos, escolha um instantâneo mais antigo.

  4. Contate o Suporte do Azure por meio de uma solicitação de suporte de alta prioridade. Solicite a restauração desse instantâneo, com o nome e a data dele. Você também pode identificá-lo pela ID de backup do HANA no site de DR. O padrão é que o lado das operações restaure apenas o volume /hana/data. Se você também quiser ter os volumes /hana/logbackups, será necessário declarar isso especificamente. Não restaure o volume /hana/shared. Em vez disso, escolha arquivos específicos, como global.ini do diretório .snapshot e de seus subdiretórios após montar novamente o volume /hana/shared para PRD.

    As operações da Microsoft seguirão estas etapas:

    a. Interromper a replicação de instantâneos do volume de produção para os volumes de recuperação de desastre. Essa interrupção já pode ter acontecido se uma interrupção no site de produção causou o desastre.

    b. Restaurar o nome do instantâneo de armazenamento ou o instantâneo com a ID de backup escolhido nos volumes de recuperação de desastre.

Após a restauração, os volumes de recuperação de desastre ficam disponíveis para serem montados no HANA em Instâncias Grandes na região de DR.

  1. Monte os volumes de recuperação de desastre para a unidade do SAP HANA em Instâncias Grandes no site de recuperação de desastre.
  2. Inicie a instância de produção do SAP HANA inativa.
  3. Digamos que você tenha optado por copiar os logs de backup do log de transações para reduzir o tempo de RPO (objetivo de ponto de recuperação). Em seguida, mescle os backups de log de transações no diretório /hana/logbackups de DR recém-montado. Não substitua backups existentes. Copie os backups mais recentes que não foram replicados com a replicação mais recente de um instantâneo de armazenamento.
  4. Também é possível restaurar arquivos únicos dos instantâneos que não foram replicados para o volume /hana/shared/PRD na região do Azure de recuperação de desastre.

Recuperar a instância de produção do SAP HANA

As próximas etapas mostram como recuperar a instância de produção do SAP HANA com base no instantâneo de armazenamento restaurado e nos backups de log de transações disponíveis.

  1. Altere o local de backup para hana/logbackups usando o SAP HANA Studio.

    Alterar o local de backup para recuperação de desastre

  2. O SAP HANA verifica os locais do arquivo de backup e sugere o backup de log de transações mais recente para o qual ser restaurado. A verificação pode levar alguns minutos até que uma tela como a seguinte seja exibida:

    Lista de backups de log de transações para recuperação de desastre

  3. Ajuste algumas destas configurações padrão:

    • Limpe Usar backups delta.
    • Selecione Inicializar área de log.

    Defina o Inicializar a área de log

  4. Selecione Concluir.

    Concluir a restauração da recuperação de desastre

Uma janela de progresso, como mostrado aqui, deve aparecer. Tenha em mente que o exemplo é de uma restauração de recuperação de desastre de uma configuração de expansão do SAP HANA de três nós.

Progresso da restauração

Se a restauração parar de responder na tela Concluir e não for mostrada na tela de andamento, confirme se todas as instâncias do SAP HANA nos nós de trabalho estão em execução. Se necessário, inicie manualmente as instâncias SAP HANA.

Failback de recuperação de desastre para um site de produção

É possível fazer failback de um site de DR para um site de produção. Vejamos um cenário em que o failover no site de DR foi causado por problemas na região de produção do Azure e não pela necessidade de recuperar dados perdidos.

Você vem executando sua carga de trabalho de produção SAP por um tempo no site de recuperação de desastre. Conforme são resolvidos os problemas no local de produção, convém executar failback no local de produção. Como não é possível perder dados, a etapa no local de produção envolve várias etapas e cooperação com a equipe de operações do SAP HANA no Azure. Cabe a você acionar a equipe de operações para iniciar a sincronização de volta ao site de produção, depois que os problemas forem resolvidos.

Siga estas etapas:

  1. A equipe de operações do SAP HANA no Azure obtém o gatilho para sincronizar os volumes de armazenamento de produção com base nos volumes de armazenamento de DR, que agora representam o estado de produção. Nesse estado, o HANA em Instância Grande no site de produção é desligado.
  2. A equipe de operações do SAP HANA do Azure monitora a replicação e garante que ela seja obtida antes de informar a você.
  3. Desligue os aplicativos que usam a instância do HANA de produção no site de recuperação de desastre. Em seguida, você faz um backup de log de transações do HANA. Depois, você interrompe a instância do HANA que está em execução noHANA em Instâncias Grandes no site de recuperação de desastre.
  4. Agora, a equipe de operações sincroniza manualmente os volumes de disco de novo.
  5. A equipe de operações do SAP HANA no Azure inicia o HANA em Instância Grande no site de produção novamente. Em seguida, a equipe a entrega para você. Verifique se a instância do SAP HANA está desligada no momento da inicialização do HANA em Instância Grande.
  6. Você executa as mesmas etapas de restauração de banco de dados de quando fez o failover anteriormente para o site de DR.

Monitorar a replicação de recuperação de desastre

Para monitorar o status do andamento da sua replicação de armazenamento, execute o script azure_hana_replication_status. Esse comando deve ser executado a partir de uma unidade em execução no site de recuperação de desastre para funcionar conforme o esperado. O comando funciona independentemente de a replicação estar ativa ou não. Ele pode ser executado para cada HANA em Instância Grande do seu locatário na localização de DR. Ele não pode ser usado para obter detalhes sobre o volume de inicialização.

Para obter mais informações sobre o comando e sua saída, consulte “Get DR Replication status - azure_hana_replication_status” em Ferramentas de instantâneo da Microsoft para SAP HANA no Azure.

Próximas etapas

Saiba mais sobre o monitoramento do SAP HANA (em Instâncias Grandes) do Azure.