Determinar estratégias de migração e alta disponibilidade no HBase do HDInsight

Concluído

Um desafio frequente enfrentado pelos clientes é migrar clusters HBase do local ou entre versões durante atualizações de cluster. O HBase do HDInsight oferece as opções a seguir para migrar, atualizar e proteger contra perda de dados.

Copie a pasta hbase

A estratégia de copiar a pasta/hbase geralmente é usada para backups ou migrações periódicas. O HBase do HDInsight armazena todos os seus arquivos de dados e metadados que foram liberados para o disco na pasta/hbase.

Observação

Esse processo não oferece a replicação em tempo real entre clusters e também não oferece granularidade de migração de tabelas específicas.

Execute as etapas abaixo em sequência para fazer o back-up/migrar um cluster HDInsight. O HDInsight /hbase é armazenado no seguinte local: wasbs://<containername>@<accountname>.blob.core.windows.net/hbase

  1. Descubra o caminho em que a pasta /hbase está localizada no cluster de origem
  2. Interrompa todas as gravações no cluster de origem e force uma liberação no disco para garantir que não haja nada na memória.
  3. Copie os dados da /hbase para o destino do Armazenamento do Azure usando AzCopy para Armazenamento de blobs ou AdlCopy para Data Lake Storage.
  4. Se esse for um cenário de DR (recuperação de desastres), os dados poderão ser armazenados em uma região diferente periodicamente para uso futuro na eventualidade de um desastre.
  5. Se esse for um cenário para uma migração do HBase, os dados poderão ser copiados para a pasta /hbase com o cluster HBase do HDInsight criado recentemente.

Mais informações sobre o processo de cópia da pasta hbase do HBase podem ser encontradas na Documentação de cópia da pasta do HBase do HDInsight.

Exportar e importar

A exportação e importação oferecem um controle melhor do processo de backup, e você pode optar por fazer o backup de tabelas específicas em vez de a pasta inteira. Esse processo usa o utilitário de exportação do cluster HBase para exportar as tabelas selecionadas para o armazenamento local que está anexado ao cluster. Faça a pós-exportação das tabelas que, então, poderão ser importadas do cluster de destino. Você encontra mais informações sobre como trabalhar com exportação e importação na Documentação de exportação e importação do HBase do HDInsight.

Copiar tabelas

Copiar tabelas é um mecanismo de cópia eficiente e que permite um controle refinado sobre o processo de cópia de tabela completa ou parcial, além de usar os caminhos de leitura e gravação do HBase para copiar parte ou toda a tabela, linha por linha, da origem para o destino. Os clusters de origem e de destino podem ser os mesmos ou diferentes. Você encontra mais informações sobre como copiar tabelas na Documentação sobre copiar tabelas do HBase do HDInsight.

Instantâneos

Os instantâneos podem habilitar backups pontuais para habilitar os requisitos de reversão de tabela. Um instantâneo não é uma cópia dos dados da tabela atual, mas, sim, informações de metadados que podem ajudar os administradores a voltar a um estado anterior das tabelas. Os instantâneos operam em um nível do HDFS e não envolvem servidores mestre e de região para otimizar os recursos do cluster. Você encontra mais informações sobre como trabalhar com instantâneos na Documentação sobre instantâneos do HBase do HDInsight.

Replicação

O recurso de replicação do HBase pode ser usado para garantir a alta disponibilidade e a continuidade dos negócios durante um desastre. Os dados são copiados entre clusters de maneira assíncrona, e as replicações podem funcionar dentro de regiões e entre regiões do Azure, garantindo modelos de alta disponibilidade e recuperação de desastre (HADR) globais. Você encontra mais informações sobre como trabalhar com a replicação do HBase na Documentação de replicação do HBase do HDInsight.