Delen via


Inleiding tot Azure Databricks-tabellen

Een tabel bevindt zich in een schema en bevat rijen met gegevens. Het standaardtabeltype dat is gemaakt in Azure Databricks, is een beheerde tabel in Unity Catalog.

De primaire differentiator voor tabeltypen in Azure Databricks is de eigenaar van de catalogus, zoals beschreven in de volgende tabel:

Tabeltype Catalogus beheren Ondersteuning voor lezen/schrijven Optimalisatie van prestaties Optimalisatie van opslagkosten
Beheerd Unity Catalogus Ja Ja Ja
Extern Geen (alleen bestanden zijn toegestaan) Ja Alleen handmatig Alleen handmatig
Buitenlands Een extern systeem of catalogusservice Alleen lezen Nee. Nee.

In het volgende voorbeeld ziet u een tabel met de naam prod.people_ops_employees die gegevens over vijf werknemers bevat. De metagegevens worden geregistreerd in Unity Catalog en de gegevens worden opgeslagen in cloudopslag.

voorbeeldtabel met gegevens van werknemers

Opslagindelingen: Delta Lake en Apache Iceberg

Tabeltypen in Azure Databricks bepalen het eigendom en de toegankelijkheid van gegevens. In de opslagindeling wordt afzonderlijk gedefinieerd hoe de gegevens fysiek zijn gestructureerd en bijgehouden op schijf.

Azure Databricks ondersteunt twee primaire open tabelindelingen: Delta Lake en Apache Iceberg. Met deze indelingen voegt u een transactionele opslaglaag toe die metagegevens bijhoudt en ACID-naleving, tijdreizen en andere functies mogelijk maakt.

  • Delta Lake is de standaardopslagindeling voor beheerde en externe tabellen in Azure Databricks.
  • Apache Iceberg wordt ondersteund voor beheerde en refererende tabellen in Azure Databricks. Deze indeling is handig wanneer u integreert met het Iceberg-ecosysteem.

Beheerde tabellen

Beheerde tabellen beheren onderliggende gegevensbestanden naast de metastore-registratie. Databricks raadt u aan beheerde tabellen te gebruiken wanneer u een nieuwe tabel maakt. Beheerde tabellen in Unity Catalog zijn de standaardtabellen wanneer u tabellen maakt in Azure Databricks. Zie Unity Catalog-beheerde tabellen in Azure Databricks voor Delta Lake en Apache Iceberg.

Externe tabellen

Externe tabellen, ook wel niet-beheerde tabellengenoemd, verwijzen naar gegevens die buiten Databricks zijn opgeslagen in een extern opslagsysteem, zoals opslag van cloudobjecten. Ze ontkoppelen het beheer van onderliggende gegevensbestanden van metastore-registratie. Unity Catalog ondersteunt externe tabellen in verschillende indelingen, waaronder Delta Lake. Externe tabellen van Unity Catalog kunnen gegevensbestanden opslaan met behulp van algemene indelingen die kunnen worden gelezen door externe systemen. Zie Werken met externe tabellen.

Externe tabellen

Externe tabellen vertegenwoordigen gegevens die in externe systemen zijn opgeslagen en via Lakehouse Federation zijn verbonden met Azure Databricks. Externe tabellen zijn in alleen-lezenmodus in Azure Databricks. Zie Werken met vreemde tabellen.

Tabellen in Unity Catalog

In Unity Catalog bevinden tabellen zich op het derde niveau van de naamruimte met drie niveaus (catalog.schema.table), zoals wordt weergegeven in het volgende diagram.

Objectmodeldiagram van Unity Catalog, gericht op tabel

Basis tabelmachtigingen

Voor de meeste tabelbewerkingen zijn USE CATALOG- en USE SCHEMA machtigingen voor de catalogus en het schema met een tabel vereist.

De volgende tabel bevat een overzicht van de aanvullende machtigingen die nodig zijn voor algemene tabelbewerkingen in Unity Catalog:

Operatie Machtigingen
Een tabel maken CREATE TABLE in de omvattende schema
Een query uitvoeren op een tabel SELECT op de tafel
Gegevens bijwerken, verwijderen, samenvoegen of invoegen in een tabel SELECT en MODIFY op de tabel
Een tabel verwijderen MANAGE op de tafel
Een tabel vervangen MANAGE op de tabel, CREATE TABLE in het omvattende schema

Zie Bevoegdheden beheren in Unity Catalogvoor meer informatie over machtigingen voor Unity Catalog.