Compartilhar via


Backup e restauração

Descreve como o backup e a restauração de dados funcionam para o Parallel Data Warehouse (PDW). As operações de backup e restauração são usadas para recuperação de desastres. O backup e a restauração também podem ser usados para copiar um banco de dados de um dispositivo para outro.

Fundamentos de backup e restauração

Um backup de banco de dados do PDW é uma cópia de um banco de dados de dispositivo, armazenado em um formato para que possa ser usado para restaurar o banco de dados original em um dispositivo.

Um backup de banco de dados PDW é criado com a instrução t-sql BACKUP DATABASE e formatado para uso com a instrução RESTORE DATABASE, sendo inutilizável para qualquer outra finalidade. O backup só pode ser restaurado em um dispositivo com o mesmo número ou um número maior de nós de computação.

O PDW usa a tecnologia de backup do SQL Server para fazer backup e restaurar bancos de dados de dispositivo. As opções de backup do SQL Server são pré-configuradas para usar a compactação de backup. Não é possível definir as opções de backup, como compactação, soma de verificação, tamanho de bloco e contagem de buffer.

Os backups de banco de dados são armazenados em um ou mais servidores de backup, que existem em sua própria rede de clientes. O PDW grava um backup de banco de dados de usuário em paralelo, diretamente dos nós de computação para um servidor de backup e restaura um backup de banco de dados de usuário em paralelo diretamente do servidor de backup para os nós de computação.

Os backups são armazenados no servidor de backup como um conjunto de arquivos no sistema de arquivos do Windows. Um backup de banco de dados do PDW só pode ser restaurado para PDW. No entanto, você pode arquivar backups de banco de dados do servidor de backup para outro local, usando processos de backup de arquivos padrão do Windows. Para obter mais informações sobre servidores de backup, consulte Adquirir e configurar um servidor de backup.

Tipos de backup de banco de dados

Há dois tipos de dados que exigem um backup: bancos de dados de usuário e bancos de dados do sistema (por exemplo, o banco de dados mestre). O PDW não faz backup do log de transações.

Um backup completo de banco de dados é um backup de um banco de dados inteiro do PDW. Esse é o tipo de backup padrão. Um backup completo de um banco de dados de usuário inclui os usuários do banco de dados e as funções do banco de dados. Um backup do banco de dados mestre inclui os logons.

Cada backup diferencial contém todas as alterações feitas no banco de dados desde o último backup completo. Um backup diferencial geralmente leva menos tempo do que um backup completo e pode ser executado com mais frequência. Quando vários backups diferenciais se baseiam no mesmo backup completo, cada diferencial inclui todas as alterações do backup diferencial anterior.

Por exemplo, você pode criar um backup completo semanalmente e um backup diferencial diariamente. Para restaurar o banco de dados de usuário, o backup completo mais o último diferencial (se houver) precisarão ser restaurados.

Um backup diferencial só é suportado para bancos de dados de usuário. Um backup do mestre é sempre um backup completo.

Para fazer backup de todo o dispositivo, você precisa executar um backup de todos os bancos de dados de usuário e um backup do banco de dados mestre.

Processo de backup do banco de dados

O diagrama a seguir mostra o fluxo de dados durante um backup de banco de dados.

PDW backup process

O processo de backup funciona da seguinte maneira:

  1. O usuário envia uma instrução tsql BACKUP DATABASE para o nó de controle.

    • O backup é um backup completo ou backup diferencial.
  2. Para bancos de dados de usuário, o nó de controle (MPP Engine) cria um plano de consulta distribuída para executar um backup de banco de dados paralelo.

  3. Cada nó envolvido no backup copia seu arquivo de backup para o servidor de backup usando a funcionalidade de backup do SQL Server.

    • Cada nó envolvido copia um arquivo de backup para o servidor de backup.

    • O backup do banco de dados de usuário (completo ou diferencial) inclui um backup da parte do banco de dados armazenada em cada nó de computação e um backup dos usuários e funções do banco de dados.

  4. O dispositivo executa o backup em paralelo usando a rede InfiniBand.

    • O PDW executa cada backup completo e diferencial em paralelo. No entanto, vários backups de banco de dados não são executados simultaneamente. Cada solicitação de backup deve aguardar a conclusão dos backups enviados anteriormente.

    • Um backup do banco de dados mestre só faz backup de dados do nó de controle. Esse tipo de backup é executado em série.

  5. Um backup de banco de dados do PDW é um grupo de arquivos armazenados em um diretório que reside fora do dispositivo. O nome do diretório é especificado como um caminho de rede e nome de diretório. O diretório não pode ser um caminho local e não pode estar no dispositivo.

  6. Depois que o backup tiver sido concluído, você poderá usar o sistema de arquivos do Windows para copiar o diretório de backup para outro local, se desejar.

    • Um backup só pode ser restaurado para um dispositivo PDW que tenha um número igual ou maior de nós de computação.

    • Não é possível alterar o nome do backup, antes de executar uma restauração. O nome do diretório de backup deve corresponder ao nome do nome original do backup. O nome original do backup está localizado no arquivo backup.xm dentro do diretório de backup. Para restaurar um banco de dados para um nome diferente, você pode especificar o novo nome no comando de restauração. Por exemplo: RESTORE DATABASE MyDB1 FROM DISK = ꞌ\\10.192.10.10\backups\MyDB2ꞌ.

Modos de restauração de banco de dados

Uma restauração completa do banco de dados recria o banco de dados do PDW usando os dados no backup do banco de dados. A restauração do banco de dados é executada restaurando primeiro um backup completo e, como opção, restaurando um backup diferencial. A restauração do banco de dados inclui os usuários e as funções do banco de dados.

Uma restauração somente de cabeçalho retorna as informações de cabeçalho de um banco de dados. Não restaura os dados do dispositivo.

Uma restauração de dispositivo é uma restauração de todo o dispositivo. Isso inclui a restauração de todos os bancos de dados de usuários e do banco de dados mestre.

Processo de restauração

O diagrama a seguir mostra o fluxo de dados durante uma restauração de banco de dados.

Restore process

Restaurar para um dispositivo com o mesmo número de nós de computação

Ao restaurar dados, o dispositivo detecta o número de nós de computação no dispositivo de origem e no dispositivo de destino. Se os dois dispositivos tiverem um número igual de nós de computação, o processo de restauração funcionará da seguinte maneira:

  1. O backup do banco de dados a ser restaurado está disponível em um compartilhamento de arquivos do Windows em um servidor de backup que não seja do dispositivo. Para obter o melhor desempenho, esse servidor está conectado à rede InfiniBand do dispositivo.

  2. O usuário envia uma instrução tsql RESTORE DATABASE para o nó de controle.

    • A restauração é uma restauração completa ou uma restauração de cabeçalho. A restauração completa restaura um backup completo e, como opção, restaura um backup diferencial.
  3. O nó de controle (MPP Engine) cria um plano de consulta distribuída para executar uma restauração de banco de dados paralela.

    • O Analytics Platform System (PDW) executa a restauração de um banco de dados de usuário em paralelo. No entanto, vários backups e restaurações de banco de dados não são executados simultaneamente. O MPP Engine coloca cada instrução restore em uma fila; Ele deve aguardar a conclusão das solicitações de backup e restauração enviadas anteriormente.

    • Uma restauração do banco de dados mestre restaura apenas os dados para o nó de controle; A restauração é executada em série.

    • Uma restauração das informações de cabeçalho é uma operação rápida e não restaura nenhum dado para os nós de computação ou nós de controle. Em vez disso, o nó de controle retorna os resultados como saída de consulta.

  4. Os arquivos de backup são copiados para os nós de computação corretos em paralelo, geralmente pela rede InfiniBand do dispositivo.

  5. Cada nó de computação restaura sua parte do banco de dados de usuário. Se qualquer uma das restaurações não for concluída com êxito, todos os bancos de dados serão removidos e a restauração será concluída sem êxito.

Restaurando para um dispositivo com um número maior de nós de Computação

A restauração de um backup em um dispositivo com um número maior de nós de Computação aumenta o tamanho do banco de dados alocado proporcionalmente ao número de nós de Computação.

Por exemplo, ao restaurar um banco de dados de 60 GB de um dispositivo de 2 nós (30 GB por nó) em um dispositivo de 6 nós, o SQL Server PDW cria um banco de dados de 180 GB (6 nós com 30 GB por nó) no dispositivo de 6 nós. Inicialmente, o SQL Server PDW restaura o banco de dados em dois nós para que isso corresponda à configuração de origem e, em seguida, redistribui os dados para todos os seis nós.

Depois da redistribuição, cada nó de computação conterá menos dados reais e mais espaço livre do que cada nó de computação no dispositivo de origem menor. Use o espaço adicional para adicionar mais dados ao banco de dados. Se o tamanho do banco de dados restaurado for maior do que o necessário, use ALTER DATABASE para reduzir os tamanhos dos arquivos de banco de dados.

Tarefas de backup e restauração Descrição
Prepare um servidor como servidor de backup. Adquirir e configurar um servidor de backup
Fazer backup de um banco de dados. BACKUP DATABASE
Restaurar um banco de dados. RESTORE DATABASE