Condividi tramite


Tabelle e viste in Azure Databricks

Questo articolo offre una panoramica di tabelle, viste, tabelle di streaming e viste materializzate in Azure Databricks.

Tavolo

Una tabella è un set di dati strutturato archiviato in una posizione specifica. Il tipo di tabella predefinito creato in Azure Databricks è una tabella gestita di Unity Catalog. Le tabelle possono essere sottoposte a query e modificate usando comandi SQL o API dataframe, supportando operazioni come INSERT, UPDATEDELETE, e MERGE INTO. Vedere Tabelle di Azure Databricks

Visualizza

Una vista è una tabella virtuale definita da una query che non archivia i dati e può presentare dati da una o più tabelle in un formato o un'astrazione specifici. Le viste sono utili per semplificare query complesse, incapsulare la logica di business e fornire un'interfaccia coerente ai dati sottostanti senza duplicare l'archiviazione. Vedere Che cos'è una visualizzazione?

Vista materializzata

Analogamente a una vista, una vista materializzata viene definita da una query. Tuttavia, a differenza di una vista, una vista materializzata calcola in anticipo e memorizza il risultato della query. Le query possono essere eseguite più velocemente sulla vista materializzata rispetto alle visualizzazioni, ma occupano spazio di archiviazione aggiuntivo. È possibile usare Databricks SQL per creare e aggiornare una vista materializzata autonoma o usare le pipeline dichiarative di Lakeflow Spark per creare e aggiornare una o più viste materializzate, tabelle di streaming e viste. Vedere Usare viste materializzate in Databricks SQL e Viste materializzate.

Tabella di streaming

Una tabella di streaming è un tipo di tabella gestita di Catalogo Unity che include la logica di elaborazione usando i flussi per definirlo. È possibile usare Databricks SQL per creare e aggiornare una tabella di streaming autonoma o usare le pipeline dichiarative di Lakeflow Spark per creare e aggiornare una o più tabelle di streaming, viste materializzate e viste. Vedere Usare tabelle di streaming in Databricks SQL e Tabelle di streaming.

Vista materializzata e tabella di streaming

Le viste materializzate e le tabelle di streaming sono due oggetti dati comuni usati per la progettazione dei dati. Le viste materializzate usano la semantica batch e le tabelle di streaming usano la semantica di streaming. Per un confronto tra batch e streaming e considerazioni sulla scelta dei carichi di lavoro di progettazione dei dati, vedere Batch e streaming di dati in Azure Databricks.