Partager via


Utiliser des tables managées

Azure Databricks gère le cycle de vie et la disposition des fichiers pour une table managée. Les tables managées constituent la méthode par défaut pour créer des tables.

Databricks recommande d’utiliser des tables managées pour toutes les données tabulaires gérées dans Azure Databricks.

Remarque

Cet article se concentre sur les tables gérées par le catalogue Unity. Les tables managées dans le metastore Hive hérité ont des comportements différents. Consultez Objets de base de données dans le metastore Hive hérité.

Utiliser des tables managées

Vous pouvez utiliser des tables managées dans tous les langages et produits pris en charge dans Azure Databricks. Vous avez besoin de certains privilèges pour créer, mettre à jour, supprimer ou interroger des tables gérées. Consultez Gérer les privilèges dans Unity Catalog.

Vous ne devez pas utiliser d’outils en dehors de Azure Databricks pour manipuler directement des fichiers dans des tables managés.

Vous devez uniquement interagir avec les fichiers de données d’une table gérée à l’aide du nom de la table.

Les fichiers de données pour les tables managées sont stockés dans l’emplacement de stockage managé associé au schéma conteneur. Consultez Spécifier un emplacement de stockage managé dans Unity Catalog.

Créer une table managée

Par défaut, chaque fois que vous créez une table à l’aide de commandes SQL, spark ou d’autres outils dans Azure Databricks, la table est gérée.

La syntaxe SQL suivante montre comment créer une table managée vide à l’aide de SQL. Remplacez les valeurs d’espace réservé :

  • <catalog-name>: Nom du catalogue qui contiendra la table.
  • <schema-name>: Nom du schéma qui contient la table.
  • <table-name>: Nom pour la table.
  • <column-specification>: Le nom et le type de données de chaque colonne.
CREATE TABLE <catalog-name>.<schema-name>.<table-name>
(
  <column-specification>
);

De nombreux utilisateurs créent des tables managées à partir de résultats de requête ou d’opérations d’écriture dataFrame. Les articles suivants illustrent certains des nombreux modèles que vous pouvez utiliser pour créer une table managée sur Azure Databricks :

Autorisations requises

Pour créer une table managée, vous devez disposer des éléments suivants :

  • Autorisation USE SCHEMA sur le schéma parent de la table.
  • Autorisation USE CATALOG sur le catalogue parent de la table.
  • Autorisation CREATE TABLE sur le schéma parent de la table.

Annuler une table managée

Vous devez être le propriétaire de la table pour la supprimer. Pour annuler une table managée, exécutez la commande SQL suivante :

DROP TABLE IF EXISTS catalog_name.schema_name.table_name;

Quand une table managée est supprimée, ses données sous-jacentes sont supprimées de votre locataire cloud dans les 30 jours.