Wat is een tabel?
Een tabel bevindt zich in een schema en bevat rijen met gegevens. Alle tabellen die in Azure Databricks zijn gemaakt, maken standaard gebruik van Delta Lake. Tabellen die worden ondersteund door Delta Lake, worden ook wel Delta-tabellen genoemd.
Een Delta-tabel slaat gegevens op als een map met bestanden in de opslag van cloudobjecten en registreert metagegevens van tabellen in de metastore binnen een catalogus en schema. Alle beheerde tabellen en streamingtabellen van Unity Catalog zijn Delta-tabellen. Externe tabellen van Unity Catalog kunnen Delta-tabellen zijn, maar zijn niet vereist.
Het is mogelijk om tabellen te maken in Databricks die geen gebruikmaken van Delta Lake. Deze tabellen bieden geen transactionele garanties of geoptimaliseerde prestaties van Delta-tabellen. U kunt ervoor kiezen om de volgende tabeltypen te maken met andere indelingen dan Delta Lake:
- Externe tabellen.
- Refererende tabellen.
- Tabellen die zijn geregistreerd bij de verouderde Hive-metastore.
In Unity Catalog bevinden tabellen zich op het derde niveau van de naamruimte op drie niveaus (catalog.schema.table
):
Azure Databricks-tabeltypen
Met Azure Databricks kunt u de volgende typen tabellen gebruiken.
Beheerde tabellen
Beheerde tabellen beheren onderliggende gegevensbestanden naast de metastore-registratie. Databricks raadt u aan beheerde tabellen te gebruiken wanneer u een nieuwe tabel maakt. Beheerde tabellen in Unity Catalog zijn de standaardtabellen wanneer u tabellen maakt in Azure Databricks. Ze gebruiken altijd Delta Lake. Zie Werken met beheerde tabellen.
Externe tabellen
Externe tabellen, ook wel niet-beheerde tabellen genoemd, ontkoppelen het beheer van onderliggende gegevensbestanden uit metastore-registratie. Externe tabellen van Unity Catalog kunnen gegevensbestanden opslaan met behulp van algemene indelingen die kunnen worden gelezen door externe systemen. Zie Werken met externe tabellen.
Delta-tabellen
De term Delta-tabel wordt gebruikt om een tabel te beschrijven die wordt ondersteund door Delta Lake. Omdat Delta-tabellen de standaardinstelling voor Azure Databricks zijn, beschrijven de meeste verwijzingen naar tabellen het gedrag van Delta-tabellen, tenzij anders vermeld.
Databricks raadt u aan altijd te communiceren met Delta-tabellen met behulp van volledig gekwalificeerde tabelnamen in plaats van bestandspaden.
Streamingtabellen
Streamingtabellen zijn Delta-tabellen die voornamelijk worden gebruikt voor het verwerken van incrementele gegevens. De meeste updates voor streamingtabellen vinden plaats via vernieuwingsbewerkingen.
U kunt streamingtabellen registreren in Unity Catalog met behulp van Databricks SQL of deze definiëren als onderdeel van een Delta Live Tables-pijplijn. Zie Gegevens laden met behulp van streamingtabellen in Databricks SQL. en wat is Delta Live Tables?
Refererende tabellen
Refererende tabellen vertegenwoordigen gegevens die zijn opgeslagen in externe systemen die zijn verbonden met Azure Databricks via Lakehouse Federation. Refererende tabellen zijn alleen-lezen in Azure Databricks. Zie Wat is Lakehouse Federation.
Functietabellen
Een Delta-tabel die wordt beheerd door Unity Catalog die een primaire sleutel heeft, is een functietabel. U kunt eventueel functietabellen configureren met behulp van de online functiestore voor use cases met lage latentie. Zie Werken met functietabellen in het werkruimte-functiearchief.
Hive-tabellen (verouderd)
Hive-tabellen beschrijven twee verschillende concepten in Azure Databricks, die beide verouderde patronen zijn en niet worden aanbevolen.
Tabellen die zijn geregistreerd met behulp van de verouderde Hive-metastoreopslaggegevens in de verouderde DBFS-hoofdmap, standaard. Databricks raadt aan om alle tabellen van de verouderde HMS te migreren naar Unity Catalog. Zie Databaseobjecten in de verouderde Hive-metastore.
Apache Spark ondersteunt het registreren en opvragen van Hive-tabellen, maar deze codecs zijn niet geoptimaliseerd voor Azure Databricks. Databricks raadt aan Hive-tabellen alleen te registreren om query's te ondersteunen op basis van gegevens die zijn geschreven door externe systemen. Zie hive-tabel (verouderd).
Livetabellen (afgeschaft)
De term livetabellen verwijst naar een eerdere implementatie van functionaliteit die nu is geïmplementeerd als gerealiseerde weergaven. Verouderde code die verwijst naar livetabellen, moet worden bijgewerkt om syntaxis te gebruiken voor gerealiseerde weergaven. Zie Wat is Delta Live Tables? en gebruik gerealiseerde weergaven in Databricks SQL.
Basistabelmachtigingen
Als u een tabel wilt maken, moeten gebruikers beschikken CREATE TABLE
over en USE SCHEMA
machtigingen voor het schema en moeten ze beschikken over de machtiging voor de USE CATALOG
bovenliggende catalogus. Als u een query wilt uitvoeren op een tabel, moeten gebruikers beschikken over de SELECT
machtiging voor de tabel, de USE SCHEMA
machtiging voor het bovenliggende schema en de machtiging voor de USE CATALOG
bovenliggende catalogus.
Zie Bevoegdheden beheren in Unity Catalog voor meer informatie over machtigingen voor Unity Catalog.
Feedback
https://aka.ms/ContentUserFeedback.
Binnenkort beschikbaar: In de loop van 2024 zullen we GitHub-problemen geleidelijk uitfaseren als het feedbackmechanisme voor inhoud en deze vervangen door een nieuw feedbacksysteem. Zie voor meer informatie:Feedback verzenden en weergeven voor