Delen via


Tabellen en weergaven in Azure Databricks

Dit artikel bevat een overzicht van tabellen, weergaven, streamingtabellen en gerealiseerde weergaven in Azure Databricks.

Tafel

Een tabel is een gestructureerde gegevensset die is opgeslagen op een specifieke locatie. Het standaardtabeltype dat is gemaakt in Azure Databricks, is een beheerde tabel in Unity Catalog. Tabellen kunnen worden opgevraagd en gemanipuleerd met behulp van SQL-opdrachten of DataFrame-API's, ondersteunende bewerkingen zoals INSERT, UPDATEen DELETE.MERGE INTO Azure Databricks-tabellen bekijken

Bekijk

Een weergave is een virtuele tabel die is gedefinieerd door een query die geen gegevens opslaat en gegevens uit een of meer tabellen in een specifieke indeling of abstractie kan presenteren. Weergaven zijn handig voor het vereenvoudigen van complexe query's, het inkapselen van bedrijfslogica en het bieden van een consistente interface voor de onderliggende gegevens zonder opslag te dupliceren. Zie Wat is een weergave?

Gerealiseerde weergave

Net als bij een weergave wordt een gerealiseerde weergave gedefinieerd door een query. In tegenstelling tot een weergave wordt een gerealiseerde weergave echter vooraf gecomputeerd en wordt het resultaat van de query opgeslagen. Query's kunnen sneller worden uitgevoerd op basis van gerealiseerde weergave dan weergaven, maar nemen extra opslagruimte in beslag. U kunt Databricks SQL gebruiken om een zelfstandige gerealiseerde weergave te maken en te vernieuwen of declaratieve pijplijnen van Lakeflow Spark gebruiken om een of meer gerealiseerde weergaven, streamingtabellen en weergaven te maken en te vernieuwen. Zie Gerealiseerde weergaven gebruiken in Databricks SQL en gerealiseerde weergaven.

Streamingtabel

Een streamingtabel is een type beheerde Unity Catalog-tabel met de verwerkingslogica die gebruikmaakt van stromen om deze te definiƫren. U kunt Databricks SQL gebruiken om een zelfstandige streamingtabel te maken en te vernieuwen, of u kunt declaratieve pijplijnen van Lakeflow Spark gebruiken om een of meer streamingtabellen, gematerialiseerde weergaven en weergaven te maken en te vernieuwen. Zie Streamingtabellen gebruiken in Databricks SQL - en Streaming-tabellen.

Gerealiseerde weergave versus streamingtabel

Gerealiseerde weergaven en streamingtabellen zijn twee algemene gegevensobjecten die worden gebruikt voor data engineering. Gerealiseerde weergaven maken gebruik van batch-semantiek en streamingtabellen maken gebruik van streaming-semantiek. Zie Batch versus streaming in Azure Databricks voor een vergelijking tussen batch- en streaminggegevensverwerking en overwegingen voor het kiezen van deze workloads voor data engineering.