Recuperação de desastres usando a ferramenta Instantâneo Consistente de Aplicativo do Azure

Este artigo explica como executar a recuperação de desastres ao usar a ferramenta Instantâneo Consistente de Aplicativo do Azure que você pode usar com os Arquivos NetApp do Azure.

Importante

Esta operação aplica-se apenas à Instância Grande do Azure.

Introdução

A plataforma de Instância Grande do Azure também pode ter um site de Recuperação de Desastres configurado para o qual os instantâneos de volume de armazenamento podem ser replicados. Se os snapshots tiverem sido configurados corretamente com essa configuração, é possível executar uma recuperação de desastres neste site. Este documento destina-se a ser um guia para executar a recuperação de desastres para esta configuração.

Pré-requisitos para a configuração da recuperação de desastres

Os pré-requisitos a seguir devem ser atendidos antes de planejar o failover de recuperação de desastres.

  • Você tem um nó DR provisionado no site de DR. Existem duas opções para DR. Uma é DR normal e outra é DR polivalente.
  • Você tem a replicação de armazenamento funcionando. A equipe de operações da Microsoft executa a configuração de replicação de armazenamento no momento do provisionamento de DR automaticamente. Você pode monitorar a replicação de armazenamento usando o comando azacsnap -c details --details replication no site de DR.
  • Você configurou e configurou instantâneos de armazenamento no local principal.
  • Você tem uma instância HANA instalada no site de DR para o primário com o mesmo SID que a instância primária.
  • Você lê e entende o procedimento de failover de DR descrito em SAP HANA Large Instances alta disponibilidade e recuperação de desastres no Azure
  • Você configurou e configurou instantâneos de armazenamento no local de DR.
  • Um arquivo de configuração (por exemplo, DR.json) foi criado com os volumes de armazenamento DR e informações associadas no servidor DR.
  • Você concluiu as etapas no site de DR para:
    • Habilite a comunicação com o armazenamento.
    • Habilite a comunicação com o SAP HANA.

Configurar a recuperação após desastre

A Microsoft oferece suporte à replicação no nível de armazenamento para recuperação de DR. Há duas maneiras de configurar a DR.

Uma é normal e outra é polivalente. Na DR normal, você tem uma instância dedicada no local de DR para failover. No cenário de DR multiuso, você tem outra instância de QA ou HANA de desenvolvimento em execução na unidade de instância grande HANA no site de DR. Mas você também instalou uma instância HANA pré-instalada que está inativa e tem o mesmo SID que a instância HANA que você deseja fazer failover para essa unidade HANA Large Instance. As operações da Microsoft configuram o ambiente para você, incluindo a replicação de armazenamento com base na entrada fornecida no Formulário de Solicitação de Serviço (SRF) no momento da integração.

Importante

Certifique-se de que todos os pré-requisitos sejam atendidos para a configuração de DR.

Monitorar a replicação de dados do local primário para o local de DR

A equipe de operações da Microsoft já gerencia e monitora o link de DR do site primário para o site de DR. Você pode monitorar a replicação de dados do servidor primário para o servidor DR usando o comando azacsnap -c details --details replicationsnapshot .

Executar um failover para o site de DR

Execute o comando failover no site DR (azacsnap -c restore --restore revertvolume).

Importante

O azacsnap -c restore --restore revertvolume comando interrompe a replicação de armazenamento do local de produção para o local de DR. Você deve entrar em contato com o Microsoft Operations para configurar a replicação novamente. Depois que a replicação for reativada, todos os dados no armazenamento de DR para esse SID serão inicializados. O comando que executa o failover disponibiliza o instantâneo de armazenamento replicado mais recentemente. Se você precisar restaurar para um instantâneo mais antigo, abra uma solicitação de suporte para que as operações possam ajudar a fornecer um instantâneo anterior restaurado no site de DR.

Em um alto nível, aqui estão as etapas a serem seguidas para failover de DR:

  • Você deve desligar a instância HANA no site primário . Essa ação é necessária somente se você estiver realmente fazendo o failover para o site de DR para não ter inconsistências de dados.
  • Desligue a instância HANA no nó DR para o SID de produção.
  • Execute o comando azacsnap -c restore --restore revertvolume no nó DR com o SID a ser recuperado
    • O comando quebra o link de replicação de armazenamento do site primário para o local de DR
    • O comando restaura apenas o volume /data e /logbackups, o volume /shared NÃO é recuperado, mas usa o /shared existente para SID no local de DR.
    • Monte o volume /data e /logbackups – certifique-se de adicioná-lo ao arquivo fstab
  • Restaure o instantâneo HANA SYSTEMDB. O estúdio HANA mostra apenas o instantâneo HANA mais recente disponível no instantâneo de armazenamento restaurado como parte da execução do comando azacsnap -c restore --restore revertvolume .
  • Recupere o banco de dados do locatário.
  • Inicie a instância HANA no site de DR para o SID de produção (exemplo: H80 neste caso).
  • Realize testes.

Exemplo de execução de recuperação de desastres

Esta subseção descreve as etapas detalhadas para um failover para o site de recuperação de desastres.

Etapa 1: Obter os detalhes do volume do nó DR

Execute o comando df –h para listar os sistemas de arquivos e os volumes associados aos quais fazer referência após o failover.

df -h
Filesystem Size Used Avail Use% Mounted on
devtmpfs 378G 8.0K 378G 1% /dev
tmpfs 569G 0 569G 0%
/dev/shm
tmpfs 378G 18M 378G 1% /run
tmpfs 378G 0 378G 0%
/sys/fs/cgroup
/dev/mapper/3600a098038304445622b4b584c575a66-part2 47G 20G 28G 42% /
/dev/mapper/3600a098038304445622b4b584c575a66-part1 979M 57M 856M 7% /boot
172.18.20.241:/hana_log_h80_mnt00003_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00001_t020_vol 512G 5.5G 507G 2% /hana/log/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00003_t020_vol 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00002_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00002_t020_vol 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00001_t020_vol 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_shared_h80_t020_vol/usr_sap_node1 2.7T 11G 2.7T 1% /usr/sap/H80
tmpfs 76G 0 76G 0% /run/user/0
172.18.20.241:/hana_shared_h80_t020_vol 2.7T 11G 2.7T 1% /hana/shared
172.18.20.241:/hana_data_h80_mnt00001_t020_xdp 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00002_t020_xdp 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00003_t020_xdp 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_backups_h80_t020_xdp 512G 15G 498G 3% /hana/logbackups/H80_T250

Etapa 2: Desligue o HANA no site primário

Se estiver executando um failover completo de cargas de trabalho de produção e for possível conectar-se ao local de produção principal, desligue a(s) instância(s) do SAP HANA que está sendo transferida para DR.

Por exemplo, se estiver conectado como root, o exemplo a seguir mostra como o SAP HANA pode ser desligado. Substitua <o sid> pelo seu SAP HANA SID.

su - <sid>adm
HDB stop

Etapa 3: Desligue o HANA no site de DR

É importante desligar o SAP HANA no site de DR antes de restaurar os volumes.

Por exemplo, se estiver conectado como root, o exemplo a seguir mostra como o SAP HANA pode ser desligado. Substitua <o sid> pelo seu SAP HANA SID.

su - <sid>adm
HDB stop

Importante

Verifique se as instâncias HANA no site de DR estão off-line antes de restaurar quaisquer volumes.

Etapa 4: Restaurar os volumes

azacsnap -c restore --restore revertvolume --dbsid H80

Saída do comando DR failover.

azacsnap --configfile DR.json -c restore --restore revertvolume --dbsid H80
* This program is designed for those customers who have previously installed the
  Production HANA instance in the Disaster Recovery Location either as a
  stand-alone instance or as part of a multi-purpose environment.
* This program should be executed from the Disaster Recovery location otherwise
  unintended consequences may result.
* This program is intended to allow the customer to complete a Disaster Recovery
  failover.
* Any other restore points must be handled by Microsoft Operations.
* All volumes ('data' and 'other') are reverted to their most recent snapshot.
* The SnapMirror replication relationship between Prod and DR will be broken.

  CAUTION: a failback will be required after running this command and failback
   might not be a quick process and will require multiple steps in coordination
   with Microsoft Operations.

Do you wish to continue? (y/n) [n]: y
Checking state of HLI volumes for SID 'H80'
Configured volumes (Data and Other) are not quiesced for revert, will retry in 00:00:10 seconds
Volumes All Ok to Revert = True
Reverting volume 'hana_data_h80_mnt00001_t020_xdp' to snapshot 'H80_HANA_DATA_30MIN.2020-09-16_0330.0'
DR.json Data Volume #1 'hana_data_h80_mnt00001_t020_xdp' assigning to mountpoint 'mnt00001'
Reverting volume 'hana_log_backups_h80_t020_xdp01' to snapshot 'H80_HANA_LOGS_3MIN_X9.2020-09-16_0339.recent'
DR.json Other Volume #1 'hana_log_backups_h80_t020_xdp01' assigning to mountpoint '01'
HLI Volume revert completed for SID 'H80'
Displaying Mount Points by Volume as follows:
10.50.251.34:/hana_data_h80_mnt00001_t020_xdp  /hana/data/H80/mnt00001 nfs  rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
10.50.251.36:/hana_log_backups_h80_t020_xdp01  /hana/log_backups/H80/01 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
*********************  HANA DR Restore Steps  **********************************
* Please complete the following steps to recover your HANA database:           *
* 1. Ensure ALL the target mount points exist to mount the snapshot clones.    *
*    e.g. mkdir /hana/logbackups/H99_SOURCE                                    *
* 2. Add Mount Point Details from 'Displaying Mount Points by Volume' as       *
*    output above into /etc/fstab of DR Server.                                *
* 3. Mount newly added filesystems.                                            *
* 4. Perform HANA Snapshot Recovery using HANA Studio.                         *
********************************************************************************

Nota

As etapas no final da exibição do console precisam ser executadas para concluir a preparação do armazenamento para um failover de DR.

Etapa 5: Desmontar sistemas de arquivos desnecessários

Execute o comando umount para desmontar os sistemas de arquivos/volumes que não são necessários.

umount <Mount point>

Desmonte os dados e registre os pontos de montagem de backup. Você pode ter vários pontos de montagem de dados no cenário de expansão.

Etapa 6: Configurar os pontos de montagem

Modifique o arquivo /etc/fstab para comentar as entradas de dados e backups de log para o SID primário (neste exemplo, SID=H80) e adicione as novas entradas de ponto de montagem criadas a partir dos volumes DR do site primário. As novas entradas de ponto de montagem são fornecidas na saída do comando.

  • Comente os pontos de montagem existentes em execução no site DR com o # caractere:

    #172.18.20.241:/hana_data_h80_mnt00001_t020_vol /hana/data/H80/mnt00001 nfs     rw,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
    #172.18.20.241:/hana_log_backups_h80_t020 /hana/logbackups/H80 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
    
  • Adicione as seguintes linhas a /etc/fstab

    esta deve ser a mesma saída do comando

    10.50.251.34:/hana_data_h80_mnt00001_t020_xdp  /hana/data/H80/mnt00001 nfs  rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
    10.50.251.36:/hana_log_backups_h80_t020_xdp01  /hana/log_backups/H80/01 nfs rw,bg,hard,timeo=600,vers=4,rsize=1048576,wsize=1048576,intr,noatime,lock 0 0
    

Etapa 7: Monte os volumes de recuperação

Execute o comando mount –a para montar todos os pontos de montagem.

mount -a

Agora, se você executar df –h , você deve ver os *_dp volumes montados.

df -h
Filesystem Size Used Avail Use% Mounted on
devtmpfs 378G 8.0K 378G 1% /dev
tmpfs 569G 0 569G 0% /dev/shm
tmpfs 378G 18M 378G 1% /run
tmpfs 378G 0 378G 0% /sys/fs/cgroup
/dev/mapper/3600a098038304445622b4b584c575a66-part2 47G 20G 28G 42% /
/dev/mapper/3600a098038304445622b4b584c575a66-part1 979M 57M 856M 7% /boot
172.18.20.241:/hana_log_h80_mnt00003_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00001_t020_vol 512G 5.5G 507G 2% /hana/log/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00003_t020_vol 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_h80_mnt00002_t020_vol 512G 2.1G 510G 1% /hana/log/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00002_t020_vol 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00001_t020_vol 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_shared_h80_t020_vol/usr_sap_node1 2.7T 11G 2.7T 1% /usr/sap/H80
tmpfs 76G 0 76G 0% /run/user/0
172.18.20.241:/hana_shared_h80_t020_vol 2.7T 11G 2.7T 1% /hana/shared
172.18.20.241:/hana_data_h80_mnt00001_t020_xdp 1.2T 6.4G 1.2T 1% /hana/data/H80/mnt00001
172.18.20.241:/hana_data_h80_mnt00002_t020_xdp 1.2T 300M 1.2T 1% /hana/data/H80/mnt00002
172.18.20.241:/hana_data_h80_mnt00003_t020_xdp 1.2T 332M 1.2T 1% /hana/data/H80/mnt00003
172.18.20.241:/hana_log_backups_h80_t020_xdp 512G 15G 498G 3% /hana/logbackups/H80_T250

Etapa 8: Recuperar o SYSTEMDB

No HANA Studio, clique com o botão direito do mouse na instância SYSTEMDB e escolha "Backup e recuperação" e, em seguida, "Recuperar banco de dados do sistema"

Consulte o guia para recuperar um banco de dados de um snapshot, especificamente o SYSTEMDB.

Etapa 9: Recuperar o banco de dados do locatário

No HANA Studio, clique com o botão direito do mouse na instância do SYSTEMDB e escolha "Backup e recuperação" e, em seguida, "Recuperar banco de dados do locatário".

Consulte o guia para recuperar um banco de dados de um instantâneo, especificamente o(s) banco(s) de dados TENANT.

Executar azacsnap -c backup no site de DR

Se você estiver executando backups baseados em instantâneo no site de DR, o Nome do Servidor HANA configurado no arquivo de configuração no azacsnap site de DR deverá ser o mesmo que o nome do servidor de produção.

Importante

Executando o azacsnap -c backup pode criar instantâneos de armazenamento no local de DR, eles não são replicados automaticamente para outro site. Trabalhe com o Microsoft Operations para entender melhor o retorno de todos os arquivos ou dados ao local de produção original.

Próximos passos