Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Een tabel bevindt zich in een schema en bevat rijen met gegevens. Het standaardtabeltype dat is gemaakt in Azure Databricks, is een beheerde tabel in Unity Catalog.
De primaire differentiator voor tabeltypen in Azure Databricks is de eigenaar van de catalogus, zoals beschreven in de volgende tabel:
Tabeltype | Catalogus beheren | Ondersteuning voor lezen/schrijven | Optimalisatie van prestaties | Optimalisatie van opslagkosten |
---|---|---|---|---|
Beheerd | Unity Catalogus | Ja | Ja | Ja |
Extern | Geen (alleen bestanden zijn toegestaan) | Ja | Alleen handmatig | Alleen handmatig |
Buitenlands | Een extern systeem of catalogusservice | Alleen lezen | Nee. | Nee. |
In het volgende voorbeeld ziet u een tabel met de naam prod.people_ops_employees
die gegevens over vijf werknemers bevat. De metagegevens worden geregistreerd in Unity Catalog en de gegevens worden opgeslagen in cloudopslag.
Opslagindelingen: Delta Lake en Apache Iceberg
Tabeltypen in Azure Databricks bepalen het eigendom en de toegankelijkheid van gegevens. In de opslagindeling wordt afzonderlijk gedefinieerd hoe de gegevens fysiek zijn gestructureerd en bijgehouden op schijf.
Azure Databricks ondersteunt twee primaire open tabelindelingen: Delta Lake en Apache Iceberg. Met deze indelingen voegt u een transactionele opslaglaag toe die metagegevens bijhoudt en ACID-naleving, tijdreizen en andere functies mogelijk maakt.
- Delta Lake is de standaardopslagindeling voor beheerde en externe tabellen in Azure Databricks.
- Apache Iceberg wordt ondersteund voor beheerde en refererende tabellen in Azure Databricks. Deze indeling is handig wanneer u integreert met het Iceberg-ecosysteem.
Beheerde tabellen
Beheerde tabellen beheren onderliggende gegevensbestanden naast de metastore-registratie. Databricks raadt u aan beheerde tabellen te gebruiken wanneer u een nieuwe tabel maakt. Beheerde tabellen in Unity Catalog zijn de standaardtabellen wanneer u tabellen maakt in Azure Databricks. Zie Unity Catalog-beheerde tabellen in Azure Databricks voor Delta Lake en Apache Iceberg.
Externe tabellen
Externe tabellen, ook wel niet-beheerde tabellengenoemd, verwijzen naar gegevens die buiten Databricks zijn opgeslagen in een extern opslagsysteem, zoals opslag van cloudobjecten. Ze ontkoppelen het beheer van onderliggende gegevensbestanden van metastore-registratie. Unity Catalog ondersteunt externe tabellen in verschillende indelingen, waaronder Delta Lake. Externe tabellen van Unity Catalog kunnen gegevensbestanden opslaan met behulp van algemene indelingen die kunnen worden gelezen door externe systemen. Zie Werken met externe tabellen.
Externe tabellen
Externe tabellen vertegenwoordigen gegevens die in externe systemen zijn opgeslagen en via Lakehouse Federation zijn verbonden met Azure Databricks. Externe tabellen zijn in alleen-lezenmodus in Azure Databricks. Zie Werken met vreemde tabellen.
Tabellen in Unity Catalog
In Unity Catalog bevinden tabellen zich op het derde niveau van de naamruimte met drie niveaus (catalog.schema.table
), zoals wordt weergegeven in het volgende diagram.
Basis tabelmachtigingen
Voor de meeste tabelbewerkingen zijn USE CATALOG
- en USE SCHEMA
machtigingen voor de catalogus en het schema met een tabel vereist.
De volgende tabel bevat een overzicht van de aanvullende machtigingen die nodig zijn voor algemene tabelbewerkingen in Unity Catalog:
Operatie | Machtigingen |
---|---|
Een tabel maken |
CREATE TABLE in de omvattende schema |
Een query uitvoeren op een tabel |
SELECT op de tafel |
Gegevens bijwerken, verwijderen, samenvoegen of invoegen in een tabel |
SELECT en MODIFY op de tabel |
Een tabel verwijderen |
MANAGE op de tafel |
Een tabel vervangen |
MANAGE op de tabel, CREATE TABLE in het omvattende schema |
Zie Bevoegdheden beheren in Unity Catalogvoor meer informatie over machtigingen voor Unity Catalog.