Partager via


Tables Azure Databricks

Azure Databricks fournit plusieurs types de tables et formats de stockage pour répondre à différents besoins de gestion des données. Cette section couvre les tables managées, externes et étrangères, ainsi que les formats de stockage Delta Lake et Apache Iceberg qui alimentent les fonctionnalités avancées telles que Atomicity, Consistency, Isolation et Durability (ACID) transactions et voyages temporels.

Concepts de base

Découvrez les principes fondamentaux des types de tables, des formats de stockage et de l’intégration du catalogue Unity.

Sujet Descriptif
Concepts des tables Concepts de base et informations fondamentales sur les types de tables, les formats de stockage et l’intégration du catalogue Unity.

Types de tables

Explorez différents types de tables et leurs fonctionnalités pour différents scénarios de gestion des données.

Type de table Descriptif
Tables managées Tables où Azure Databricks gère à la fois les métadonnées et les fichiers de données. Recommandé pour les nouvelles tables avec des performances et un stockage optimisés.
tables externes Tables qui référencent les données stockées dans des systèmes de stockage externes lors de la gestion des métadonnées dans le catalogue Unity.
Tables étrangères Tables en lecture seule représentant des données dans des systèmes externes connectés via lakehouse Federation.

Formats de stockage

Utilisez des formats de table ouverts qui fournissent des fonctionnalités avancées de gestion des données.

Format Descriptif
Delta Lake Le format de stockage par défaut fournit des transactions ACID, un voyage de temps et une application de schéma pour les tables managées et externes.
Apache Iceberg Ouvrez le format de table pour l’intégration à l’écosystème Iceberg, prenant en charge la gestion avancée des métadonnées.

Gestion des tables

Configurez et optimisez le comportement, la structure et les performances des tables.

Caractéristique Descriptif
Contraintes de table Définissez et appliquez des règles de qualité des données avec des contraintes de vérification et non des contraintes Null.
Mise en œuvre du schéma Contrôlez la façon dont Azure Databricks gère les modifications de schéma et l’application du type de données pendant les écritures.
Partitionnement de tables Organisez les données par clés de partition pour améliorer les performances des requêtes et la gestion des données.
Surveillance de la taille des tables Surveillez et analysez les modèles d’utilisation et de croissance du stockage de tables.
Convertir un externe en géré Migrez des tables externes vers des tables managées pour améliorer les performances et la gestion.
Découverte de partition externe Découvrez et inscrivez automatiquement des partitions dans des tables externes stockées dans le stockage cloud.