Delen via


Azure Databricks-tabellen

Azure Databricks biedt meerdere tabeltypen en opslagindelingen om te voldoen aan verschillende behoeften voor gegevensbeheer. In deze sectie worden beheerde, externe en refererende tabellen behandeld, samen met de Delta Lake- en Apache Iceberg-opslagindelingen die geavanceerde functies mogelijk maken, zoals Atomiciteit, Consistentie, Isolatie en Duurzaamheid (ACID) en tijdreizen.

Basisconcepten

Meer informatie over de basisprincipes van tabeltypen, opslagindelingen en Unity Catalog-integratie.

Onderwerp Description
Concepten van tabellen Basisconcepten en basisinformatie over tabeltypen, opslagindelingen en Integratie van Unity Catalog.

Tabeltypen

Verken verschillende tabeltypen en hun mogelijkheden voor verschillende scenario's voor gegevensbeheer.

Tabeltype Description
Beheerde tabellen Tabellen waarin Azure Databricks zowel metagegevens als gegevensbestanden beheert. Aanbevolen voor nieuwe tabellen met geoptimaliseerde prestaties en opslag.
externe tabellen Tabellen die verwijzen naar gegevens die zijn opgeslagen in externe opslagsystemen tijdens het beheren van metagegevens in Unity Catalog.
Refererende tabellen Alleen-lezen tabellen die gegevens vertegenwoordigen in externe systemen die zijn verbonden via Lakehouse Federation.

Opslagindelingen

Werk met open tabelindelingen die geavanceerde mogelijkheden voor gegevensbeheer bieden.

Formaat Description
Delta Lake Standaardopslagindeling die ACID-transacties, tijdreizen en schema afdwinging biedt voor beheerde en externe tabellen.
Apache Iceberg Open tabelindeling voor integratie met het Iceberg-ecosysteem, ter ondersteuning van geavanceerd metagegevensbeheer.

Tabelbeheer

Tabelgedrag, structuur en prestaties configureren en optimaliseren.

Eigenschap Description
Tabelbeperkingen Regels voor gegevenskwaliteit definiƫren en afdwingen met controlebeperkingen en niet null-beperkingen.
Schema afdwingen Bepalen hoe Azure Databricks schemawijzigingen verwerkt en afdwinging van gegevenstypen tijdens schrijfbewerkingen.
Tabelpartitionering Organiseer gegevens op partitiesleutels om queryprestaties en gegevensbeheer te verbeteren.
Bewaking van tabelgrootte Bewaak en analyseer tabelopslaggebruik en groeipatronen.
Extern converteren naar beheerd Externe tabellen migreren naar beheerde tabellen voor verbeterde prestaties en beheer.
Detectie van externe partities Automatisch partities detecteren en registreren in externe tabellen die zijn opgeslagen in cloudopslag.