Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Azure Databricks fournit plusieurs types de tables et formats de stockage pour répondre à différents besoins de gestion des données. Cette section couvre les tables managées, externes et étrangères, ainsi que les formats de stockage Delta Lake et Apache Iceberg qui alimentent les fonctionnalités avancées telles que Atomicity, Consistency, Isolation et Durability (ACID) transactions et voyages temporels.
Concepts de base
Découvrez les principes fondamentaux des types de tables, des formats de stockage et de l’intégration du catalogue Unity.
| Sujet | Descriptif |
|---|---|
| Concepts des tables | Concepts de base et informations fondamentales sur les types de tables, les formats de stockage et l’intégration du catalogue Unity. |
Types de tables
Explorez différents types de tables et leurs fonctionnalités pour différents scénarios de gestion des données.
| Type de table | Descriptif |
|---|---|
| Tables managées | Tables où Azure Databricks gère à la fois les métadonnées et les fichiers de données. Recommandé pour les nouvelles tables avec des performances et un stockage optimisés. |
| tables externes | Tables qui référencent les données stockées dans des systèmes de stockage externes lors de la gestion des métadonnées dans le catalogue Unity. |
| Tables étrangères | Tables en lecture seule représentant des données dans des systèmes externes connectés via lakehouse Federation. |
Formats de stockage
Utilisez des formats de table ouverts qui fournissent des fonctionnalités avancées de gestion des données.
| Format | Descriptif |
|---|---|
| Delta Lake | Le format de stockage par défaut fournit des transactions ACID, un voyage de temps et une application de schéma pour les tables managées et externes. |
| Apache Iceberg | Ouvrez le format de table pour l’intégration à l’écosystème Iceberg, prenant en charge la gestion avancée des métadonnées. |
Gestion des tables
Configurez et optimisez le comportement, la structure et les performances des tables.
| Caractéristique | Descriptif |
|---|---|
| Contraintes de table | Définissez et appliquez des règles de qualité des données avec des contraintes de vérification et non des contraintes Null. |
| Mise en œuvre du schéma | Contrôlez la façon dont Azure Databricks gère les modifications de schéma et l’application du type de données pendant les écritures. |
| Partitionnement de tables | Organisez les données par clés de partition pour améliorer les performances des requêtes et la gestion des données. |
| Surveillance de la taille des tables | Surveillez et analysez les modèles d’utilisation et de croissance du stockage de tables. |
| Convertir un externe en géré | Migrez des tables externes vers des tables managées pour améliorer les performances et la gestion. |
| Découverte de partition externe | Découvrez et inscrivez automatiquement des partitions dans des tables externes stockées dans le stockage cloud. |