Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Important
La mise à l’échelle automatique Lakebase est en version bêta dans les régions suivantes : eastus2, westeurope, westus.
La version Autoscaling de Lakebase est la dernière de Lakebase, offrant l'autoscaling, la mise à l'échelle à zéro, la bifurcation et la restauration instantanée. Pour la comparaison des fonctionnalités avec Lakebase Provisioned, consultez le choix entre les versions.
Cette rubrique explique comment créer une sauvegarde de votre base de données Lakebase à l’aide de l’utilitaire Postgres pg_dump et comment restaurer une sauvegarde à l’aide pg_restorede .
Quand utiliser pg_dump &pg_restore
Utilisez pg_dump et pg_restore pour les besoins en matière de reprise d’activité et de continuité d’activité, ou lorsque vous devez stocker des sauvegardes complètes en dehors de Lakebase. Cette méthode fournit des exportations de base de données complètes qui peuvent être stockées indépendamment et restaurées sur n’importe quel système compatible Postgres.
Conditions préalables
Avant de commencer, vérifiez que :
-
pg_dumpetpg_restoresont installés. Vous pouvez vérifier en exécutantpg_dump -V. - Vous utilisez les dernières versions de
pg_dumpetpg_restore. - La version du client correspond à la version Postgres de votre projet Lakebase.
- Projet Lakebase avec un rôle Postgres configuré
Note
Nous vous recommandons d’utiliser l’authentification par mot de passe Postgres native lors de l’utilisation pg_dump et pg_restore. Les mots de passe Postgres natifs n’expirent pas toutes les heures comme les jetons OAuth, ce qui les rend mieux adaptés aux opérations de sauvegarde et de restauration. Pour plus d’informations sur les méthodes d’authentification, consultez la vue d’ensemble de l’authentification.
Installer pg_dump et pg_restore
Si vous n’avez pas installé les utilitaires pg_dump et pg_restore localement, installez-les sur votre plateforme préférée.
Windows: Installez PostgreSQL à l’aide du programme d’installation officiel à partir de postgresql.org. Les pg_dump utilitaires et pg_restore les utilitaires sont installés par défaut et se trouvent dans le répertoire bin PostgreSQL.
Macos: Installez PostgreSQL à l’aide de Homebrew :
brew install postgresql
Linux (Ubuntu/Debian) :
sudo apt-get install postgresql-client
Docker : Exécutez pg_dump en utilisant un conteneur Docker Postgres :
docker run --rm postgres:15 pg_dump --version
Créer une sauvegarde avec pg_dump
Pour créer une sauvegarde de base de données localement :
Accédez à l’application Lakebase en cliquant sur le sélecteur d’applications dans le coin supérieur droit de votre espace de travail.
Sélectionnez votre projet.
Cliquez sur Se connecter pour ouvrir le mode de connexion de base de données.
Sélectionnez un rôle Postgres dans la liste déroulante (nous vous recommandons d’utiliser un rôle Postgres natif avec l’authentification par mot de passe).
Copiez la chaîne de connexion.
Votre chaîne de connexion ressemble à ceci :
postgresql://role_name:password@ep-source-abc-123.databricks.com/databricks_postgres?sslmode=requireCréez une sauvegarde de votre base de données Lakebase en exécutant la commande suivante
pg_dump:pg_dump -Fc -v -d "<lakebase_database_connection_string>" -f <dump_file_name>Après avoir ajouté la chaîne de connexion de votre base de données Lakebase et un nom de fichier de sauvegarde, la commande s'affiche comme suit :
pg_dump -Fc -v -d "postgresql://role_name:password@ep-source-abc-123.databricks.com/databricks_postgres?sslmode=require" -f mydatabase.bak
arguments de commande pg_dump
La pg_dump commande inclut ces arguments :
-
-Fc: envoie la sortie à une archive de format personnalisé adaptée à l’entrée danspg_restore. -
-v: fonctionnepg_dumpen mode verbeux, ce qui vous permet de surveiller ce qui se passe pendant l’opération de vidage. -
-d: spécifie la chaîne de connexion pour votre base de données Lakebase. -
-f <dump_file_name>: nom du fichier de vidage. Il peut s’agir de n’importe quel nom que vous choisissez (par exemple).mydumpfile.bak
Restaurer une sauvegarde avec pg_restore
Pour restaurer une base de données à l’aide de l’utilitaire pg_restore à partir d’un fichier de sauvegarde créé à l’aide pg_dumpde :
Créez un projet Lakebase.
Créez une base de données portant le même nom que celle que vous avez sauvegardée.
Accédez à l’application Lakebase en cliquant sur le sélecteur d’applications dans le coin supérieur droit de votre espace de travail.
Sélectionnez votre projet, puis cliquez sur Se connecter pour ouvrir le mode de connexion de base de données.
Sélectionnez un rôle Postgres dans la liste déroulante (nous vous recommandons d’utiliser un rôle Postgres natif avec l’authentification par mot de passe).
Copiez la chaîne de connexion.
Votre chaîne de connexion ressemble à ceci :
postgresql://role_name:password@ep-destination-xyz-456.databricks.com/databricks_postgres?sslmode=requireRestaurez vos données dans la base de données cible dans Lakebase avec
pg_restore:pg_restore -v -d "<lakebase_database_connection_string>" <dump_file_name>Après avoir ajouté votre chaîne de connexion de base de données Lakebase et le nom du fichier de vidage, votre commande ressemble à ceci :
pg_restore -v -d "postgresql://role_name:password@ep-destination-xyz-456.databricks.com/databricks_postgres?sslmode=require" mydatabase.bak
arguments de commande pg_restore
La pg_restore commande inclut ces arguments :
-
-v: s’exécutepg_restoreen mode détaillé, ce qui vous permet de surveiller ce qui se passe pendant l’opération de restauration. -
-d: spécifie la base de données Lakebase à laquelle se connecter. La valeur est une chaîne de connexion de base de données Lakebase. -
<dump_file_name>: nom du fichier de vidage que vous avez créé avecpg_dump.
Exemple complet
L’exemple suivant montre comment les données sont vidées à partir d’une base de données source nommée databricks_postgres dans un projet Lakebase et restaurées dans une base de données dans un databricks_postgres autre projet Lakebase.
Avant d’effectuer cette procédure :
- Un nouveau projet Lakebase a été créé pour la base de données de destination (qui inclut la base de données par défaut
databricks_postgres) - Les chaînes de connexion pour les bases de données source et de destination ont été collectées :
-
Source:
postgresql://role_name:password@ep-source-abc-123.databricks.com/databricks_postgres?sslmode=require -
Destination:
postgresql://role_name:password@ep-destination-xyz-456.databricks.com/databricks_postgres?sslmode=require
-
Source:
Procédure de sauvegarde et de restauration :
# Create a directory for the dump
mkdir mydump && cd mydump
# Create the backup
pg_dump -Fc -v -d "postgresql://role_name:password@ep-source-abc-123.databricks.com/databricks_postgres?sslmode=require" -f mydatabase.bak
# Verify the backup file was created
ls
mydatabase.bak
# Restore the backup to the destination database
pg_restore -v -d "postgresql://role_name:password@ep-destination-xyz-456.databricks.com/databricks_postgres?sslmode=require" mydatabase.bak