Partager via


Sauvegarde et restauration

Décrit le fonctionnement de la sauvegarde et de la restauration des données pour Parallel Data Warehouse (PDW). Les opérations de sauvegarde et de restauration sont utilisées pour la récupération d’urgence. La sauvegarde et la restauration peuvent également être utilisées pour copier une base de données d’une appliance vers une autre appliance.

Bases de la sauvegarde et de la restauration

Une sauvegarde de base de données PDW est une copie d’une base de données d’appliance, stockée dans un format afin qu’elle puisse être utilisée pour restaurer la base de données d’origine sur une appliance.

Une sauvegarde de base de données PDW est créée avec l’instruction BACKUP DATABASE t-sql et mise en forme pour une utilisation avec l’instruction RESTORE DATABASE ; elle n’est pas utilisable à tout autre effet. La sauvegarde peut uniquement être restaurée sur une appliance avec le même nombre ou un plus grand nombre de nœuds de calcul.

PDW utilise la technologie de sauvegarde SQL Server pour sauvegarder et restaurer des bases de données d’appliance. Les options de sauvegarde SQL Server sont préconfigurées pour utiliser la compression de sauvegarde. Vous ne pouvez pas définir des options de sauvegarde comme la compression, la somme de contrôle, la taille des blocs ou le nombre de tampons.

Les sauvegardes de base de données sont stockées sur un ou plusieurs serveurs de sauvegarde, qui existent dans votre propre réseau client. PDW écrit une sauvegarde de base de données utilisateur en parallèle directement à partir des nœuds de calcul vers un serveur de sauvegarde et restaure une sauvegarde de base de données utilisateur en parallèle directement à partir du serveur de sauvegarde vers les nœuds de calcul.

Les sauvegardes sont stockées sur le serveur de sauvegarde sous la forme d’un ensemble de fichiers dans le système de fichiers Windows. Une sauvegarde de base de données PDW ne peut être restaurée que sur PDW. Toutefois, vous pouvez archiver les sauvegardes de base de données du serveur de sauvegarde vers un autre emplacement à l’aide de processus de sauvegarde de fichiers Windows standard. Pour plus d’informations sur les serveurs de sauvegarde, consultez Acquérir et configurer un serveur de sauvegarde.

Types de sauvegarde de base de données

Il existe deux types de données qui nécessitent une sauvegarde : les bases de données utilisateur et les bases de données système (par exemple, la base de données master). PDW ne sauvegarde pas le journal des transactions.

Une sauvegarde complète de base de données est une sauvegarde d’une base de données PDW entière. Il s’agit du type de sauvegarde par défaut. Une sauvegarde complète d’une base de données utilisateur comprend des utilisateurs de base de données et des rôles de base de données. Une sauvegarde de master inclut des connexions.

Une sauvegarde différentielle contient toutes les modifications depuis la dernière sauvegarde complète. Généralement, une sauvegarde différentielle prend moins de temps qu’une sauvegarde complète et peut être effectuée plus souvent. Lorsque plusieurs sauvegardes différentielles sont basées sur la même sauvegarde complète, chaque différentiel inclut toutes les modifications apportées au différentiel précédent.

Par exemple, vous pouvez créer une sauvegarde complète chaque semaine et une sauvegarde différentielle quotidienne. Pour restaurer la base de données utilisateur, la sauvegarde complète plus le dernier différentiel (s’il en existe) doit être restauré.

Une sauvegarde différentielle est prise en charge uniquement pour les bases de données utilisateur. Une sauvegarde de master est toujours une sauvegarde complète.

Pour sauvegarder l’ensemble de l’appliance, vous devez effectuer une sauvegarde de toutes les bases de données utilisateur et une sauvegarde de la base de données master.

Processus de sauvegarde de base de données

Le diagramme suivant montre le flux de données pendant une sauvegarde de base de données.

PDW backup process

Le processus de sauvegarde fonctionne comme suit :

  1. L’utilisateur envoie une instruction BACKUP DATABASE tsql au nœud Control.

    • La sauvegarde est une sauvegarde complète ou différentielle.
  2. Pour les bases de données utilisateur, le nœud Contrôle (moteur MPP) crée un plan de requête distribué pour effectuer une sauvegarde de base de données parallèle.

  3. Chaque nœud impliqué dans la sauvegarde copie son fichier de sauvegarde sur le serveur de sauvegarde à l’aide de la fonctionnalité de sauvegarde SQL Server.

    • Chaque nœud impliqué copie un fichier de sauvegarde sur le serveur de sauvegarde.

    • La sauvegarde de base de données utilisateur (complète ou différentielle) inclut une sauvegarde de la partie de la base de données stockée sur chaque nœud de calcul, ainsi qu’une sauvegarde des utilisateurs de la base de données et des rôles de base de données.

  4. L’appliance effectue la sauvegarde en parallèle à l’aide du réseau InfiniBand.

    • PDW effectue chaque sauvegarde complète et différentielle en parallèle. Toutefois, plusieurs sauvegardes de base de données ne s’exécutent pas simultanément. Chaque demande de sauvegarde doit attendre la fin des sauvegardes précédemment envoyées.

    • Une sauvegarde de la base de données master sauvegarde uniquement les données à partir du nœud Contrôle. Ce type de sauvegarde est exécuté en série.

  5. Une sauvegarde de base de données PDW est un groupe de fichiers stockés dans un répertoire qui se trouve hors de l’appliance. Le nom du répertoire est spécifié sous la forme d’un chemin d’accès réseau et d’un nom de répertoire. Le répertoire ne peut pas être un chemin local et il ne peut pas se trouver sur l’appliance.

  6. Une fois la sauvegarde terminée, vous pouvez utiliser le système de fichiers Windows pour copier le répertoire de sauvegarde vers un autre emplacement, si vous le souhaitez.

    • Une sauvegarde peut uniquement être restaurée sur une appliance PDW qui a un nombre égal ou supérieur de nœuds de calcul.

    • Vous ne pouvez pas modifier le nom de la sauvegarde avant d’effectuer une restauration. Le nom du répertoire de sauvegarde doit correspondre au nom du nom d’origine de la sauvegarde. Le nom d’origine de la sauvegarde se trouve dans le fichier backup.xml dans le répertoire de sauvegarde. Pour restaurer une base de données à un autre nom, vous pouvez spécifier le nouveau nom dans la commande restore. Par exemple : RESTORE DATABASE MyDB1 FROM DISK = ꞌ\\10.192.10.10\backups\MyDB2ꞌ.

Modes de restauration de base de données

Une restauration complète de la base de données crée à nouveau la base de données PDW à l’aide des données de la sauvegarde de la base de données. La restauration de la base de données est effectuée en restaurant d’abord une sauvegarde complète, puis en restaurant éventuellement une sauvegarde différentielle. La restauration de base de données inclut les utilisateurs de base de données et les rôles de base de données.

Une restauration d’en-tête renvoie uniquement les informations d’en-tête d’une base de données. Elle ne restaure pas les données sur l’appliance.

Une restauration d’appliance est une restauration de l’ensemble de l’appliance. Cela inclut la restauration de toutes les bases de données utilisateur et de la base de données master.

Processus de restauration

Le diagramme suivant montre le flux de données lors d’une restauration de base de données.

Restore process

Restauration sur une appliance avec le même nombre de nœuds de calcul**

Lors de la restauration des données, l’appliance détecte le nombre de nœuds de calcul sur l’appliance source et l’appliance de destination. Si les deux appliances ont un nombre égal de nœuds de calcul, le processus de restauration fonctionne comme suit :

  1. La sauvegarde de base de données à restaurer est disponible sur un partage de fichiers Windows sur un serveur de sauvegarde non-appliance. Pour des performances optimales, ce serveur est connecté au réseau InfiniBand de l’appliance.

  2. L’utilisateur envoie une instruction restore DATABASE tsql au nœud Control.

    • La restauration est une restauration complète ou une restauration d’en-tête. La restauration complète restaure une sauvegarde complète, puis restaure éventuellement une sauvegarde différentielle.
  3. Le nœud De contrôle (moteur MPP) crée un plan de requête distribué pour effectuer une restauration de base de données parallèle.

    • Analytics Platform System (PDW) effectue la restauration d’une base de données utilisateur en parallèle. Toutefois, plusieurs sauvegardes et restaurations de base de données ne sont pas exécutées simultanément. Le moteur MPP place chaque instruction de restauration dans une file d’attente ; elle doit attendre que les demandes de sauvegarde et de restauration précédemment envoyées se terminent.

    • Une restauration de la base de données master restaure uniquement les données sur le nœud Contrôle ; la restauration est effectuée en série.

    • Une restauration des informations d’en-tête est une opération rapide et ne restaure aucune donnée sur les nœuds de calcul ou de contrôle. Au lieu de cela, le nœud Contrôle retourne les résultats sous forme de sortie de requête.

  4. Les fichiers de sauvegarde sont copiés sur les nœuds de calcul appropriés en parallèle, généralement sur le réseau InfiniBand de l’appliance.

  5. Chaque nœud de calcul restaure sa partie de la base de données utilisateur. Si l’une des restaurations ne se termine pas correctement, toutes les bases de données sont supprimées et la restauration échoue.

Restauration dans une appliance dotée d’un plus grand nombre de nœuds de calcul

Le fait de restaurer une sauvegarde dans une appliance dotée d’un plus grand nombre de nœuds de calcul a pour effet d’accroître la taille de la base de données allouée de façon proportionnelle au nombre de nœuds de calcul.

Par exemple, lors de la restauration d’une base de données de 60 Go à partir d’une appliance à 2 nœuds (30 Go par nœud) vers une appliance à 6 nœuds, SQL Server PDW crée une base de données de 180 Go (6 nœuds avec 30 Go par nœud) sur l’appliance à 6 nœuds. SQL Server PDW restaure initialement la base de données sur 2 nœuds pour qu’elle corresponde à la configuration source, puis redistribue les données à tous les 6 nœuds.

Après la redistribution, chaque nœud de calcul contient moins de données réelles et plus d’espace libre que chaque nœud de calcul sur l’appliance source plus petite. Profitez de l’espace supplémentaire pour ajouter davantage de données à la base de données. Si la taille de base de données restaurée est supérieure à celle dont vous avez besoin, vous pouvez utiliser ALTER DATABASE pour réduire les tailles de fichier de base de données.

Tâche de sauvegarde et de restauration Description
Préparez un serveur en tant que serveur de sauvegarde. Obtenir et configurer un serveur de sauvegarde
Sauvegardez une base de données. BACKUP DATABASE
Restaurer la base de données. RESTORE DATABASE