Delen via


Wat is een tabel?

Een tabel bevindt zich in een schema en bevat rijen met gegevens. Alle tabellen die in Azure Databricks zijn gemaakt, maken standaard gebruik van Delta Lake. Tabellen die worden ondersteund door Delta Lake, worden ook wel Delta-tabellen genoemd.

Een Delta-tabel slaat gegevens op als een map met bestanden in de opslag van cloudobjecten en registreert metagegevens van tabellen in de metastore binnen een catalogus en schema. Alle beheerde tabellen en streamingtabellen van Unity Catalog zijn Delta-tabellen. Externe tabellen van Unity Catalog kunnen Delta-tabellen zijn, maar zijn niet vereist.

Het is mogelijk om tabellen te maken in Databricks die geen gebruikmaken van Delta Lake. Deze tabellen bieden geen transactionele garanties of geoptimaliseerde prestaties van Delta-tabellen. U kunt ervoor kiezen om de volgende tabeltypen te maken met andere indelingen dan Delta Lake:

  • Externe tabellen.
  • Refererende tabellen.
  • Tabellen die zijn geregistreerd bij de verouderde Hive-metastore.

In Unity Catalog bevinden tabellen zich op het derde niveau van de naamruimte op drie niveaus (catalog.schema.table):

Objectmodeldiagram van Unity Catalog, gericht op tabel

Azure Databricks-tabeltypen

Met Azure Databricks kunt u de volgende typen tabellen gebruiken.

Beheerde tabellen

Beheerde tabellen beheren onderliggende gegevensbestanden naast de metastore-registratie. Databricks raadt u aan beheerde tabellen te gebruiken wanneer u een nieuwe tabel maakt. Beheerde tabellen in Unity Catalog zijn de standaardtabellen wanneer u tabellen maakt in Azure Databricks. Ze gebruiken altijd Delta Lake. Zie Werken met beheerde tabellen.

Externe tabellen

Externe tabellen, ook wel niet-beheerde tabellen genoemd, ontkoppelen het beheer van onderliggende gegevensbestanden uit metastore-registratie. Externe tabellen van Unity Catalog kunnen gegevensbestanden opslaan met behulp van algemene indelingen die kunnen worden gelezen door externe systemen. Zie Werken met externe tabellen.

Delta-tabellen

De term Delta-tabel wordt gebruikt om een tabel te beschrijven die wordt ondersteund door Delta Lake. Omdat Delta-tabellen de standaardinstelling voor Azure Databricks zijn, beschrijven de meeste verwijzingen naar tabellen het gedrag van Delta-tabellen, tenzij anders vermeld.

Databricks raadt u aan altijd te communiceren met Delta-tabellen met behulp van volledig gekwalificeerde tabelnamen in plaats van bestandspaden.

Streamingtabellen

Streamingtabellen zijn Delta-tabellen die voornamelijk worden gebruikt voor het verwerken van incrementele gegevens. De meeste updates voor streamingtabellen vinden plaats via vernieuwingsbewerkingen.

U kunt streamingtabellen registreren in Unity Catalog met behulp van Databricks SQL of deze definiëren als onderdeel van een Delta Live Tables-pijplijn. Zie Gegevens laden met behulp van streamingtabellen in Databricks SQL. en wat is Delta Live Tables?

Refererende tabellen

Refererende tabellen vertegenwoordigen gegevens die zijn opgeslagen in externe systemen die zijn verbonden met Azure Databricks via Lakehouse Federation. Refererende tabellen zijn alleen-lezen in Azure Databricks. Zie Wat is Lakehouse Federation.

Functietabellen

Een Delta-tabel die wordt beheerd door Unity Catalog die een primaire sleutel heeft, is een functietabel. U kunt eventueel functietabellen configureren met behulp van de online functiestore voor use cases met lage latentie. Zie Werken met functietabellen in het werkruimte-functiearchief.

Hive-tabellen (verouderd)

Hive-tabellen beschrijven twee verschillende concepten in Azure Databricks, die beide verouderde patronen zijn en niet worden aanbevolen.

Tabellen die zijn geregistreerd met behulp van de verouderde Hive-metastoreopslaggegevens in de verouderde DBFS-hoofdmap, standaard. Databricks raadt aan om alle tabellen van de verouderde HMS te migreren naar Unity Catalog. Zie Databaseobjecten in de verouderde Hive-metastore.

Apache Spark ondersteunt het registreren en opvragen van Hive-tabellen, maar deze codecs zijn niet geoptimaliseerd voor Azure Databricks. Databricks raadt aan Hive-tabellen alleen te registreren om query's te ondersteunen op basis van gegevens die zijn geschreven door externe systemen. Zie hive-tabel (verouderd).

Livetabellen (afgeschaft)

De term livetabellen verwijst naar een eerdere implementatie van functionaliteit die nu is geïmplementeerd als gerealiseerde weergaven. Verouderde code die verwijst naar livetabellen, moet worden bijgewerkt om syntaxis te gebruiken voor gerealiseerde weergaven. Zie Wat is Delta Live Tables? en gebruik gerealiseerde weergaven in Databricks SQL.

Basistabelmachtigingen

Als u een tabel wilt maken, moeten gebruikers beschikken CREATE TABLE over en USE SCHEMA machtigingen voor het schema en moeten ze beschikken over de machtiging voor de USE CATALOG bovenliggende catalogus. Als u een query wilt uitvoeren op een tabel, moeten gebruikers beschikken over de SELECT machtiging voor de tabel, de USE SCHEMA machtiging voor het bovenliggende schema en de machtiging voor de USE CATALOG bovenliggende catalogus.

Zie Bevoegdheden beheren in Unity Catalog voor meer informatie over machtigingen voor Unity Catalog.