Utiliser des tables managées
Azure Databricks gère le cycle de vie et la disposition des fichiers pour une table managée. Les tables managées constituent la méthode par défaut pour créer des tables.
Databricks recommande d’utiliser des tables managées pour toutes les données tabulaires gérées dans Azure Databricks.
Remarque
Cet article se concentre sur les tables gérées par le catalogue Unity. Les tables managées dans le metastore Hive hérité ont des comportements différents. Consultez Objets de base de données dans le metastore Hive hérité.
Utiliser des tables managées
Vous pouvez utiliser des tables managées dans tous les langages et produits pris en charge dans Azure Databricks. Vous avez besoin de certains privilèges pour créer, mettre à jour, supprimer ou interroger des tables gérées. Consultez Gérer les privilèges dans Unity Catalog.
Vous ne devez pas utiliser d’outils en dehors de Azure Databricks pour manipuler directement des fichiers dans des tables managés.
Vous devez uniquement interagir avec les fichiers de données d’une table gérée à l’aide du nom de la table.
Les fichiers de données pour les tables managées sont stockés dans l’emplacement de stockage managé associé au schéma conteneur. Consultez Spécifier un emplacement de stockage managé dans Unity Catalog.
Créer une table managée
Par défaut, chaque fois que vous créez une table à l’aide de commandes SQL, spark ou d’autres outils dans Azure Databricks, la table est gérée.
La syntaxe SQL suivante montre comment créer une table managée vide à l’aide de SQL. Remplacez les valeurs d’espace réservé :
<catalog-name>
: Nom du catalogue qui contiendra la table.<schema-name>
: Nom du schéma qui contient la table.<table-name>
: Nom pour la table.<column-specification>
: Le nom et le type de données de chaque colonne.
CREATE TABLE <catalog-name>.<schema-name>.<table-name>
(
<column-specification>
);
De nombreux utilisateurs créent des tables managées à partir de résultats de requête ou d’opérations d’écriture dataFrame. Les articles suivants illustrent certains des nombreux modèles que vous pouvez utiliser pour créer une table managée sur Azure Databricks :
- CREATE TABLE [USING]
- CREATE TABLE LIKE
- Créer ou modifier une table à l’aide du chargement de fichiers
Autorisations requises
Pour créer une table managée, vous devez disposer des éléments suivants :
- Autorisation
USE SCHEMA
sur le schéma parent de la table. - Autorisation
USE CATALOG
sur le catalogue parent de la table. - Autorisation
CREATE TABLE
sur le schéma parent de la table.
Annuler une table managée
Vous devez être le propriétaire de la table pour la supprimer. Pour annuler une table managée, exécutez la commande SQL suivante :
DROP TABLE IF EXISTS catalog_name.schema_name.table_name;
Quand une table managée est supprimée, ses données sous-jacentes sont supprimées de votre locataire cloud dans les 30 jours.