Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Questa pagina descrive i requisiti per la creazione e l'aggiornamento di viste materializzate autonome e tabelle di streaming.
È possibile creare e aggiornare viste materializzate autonome e tabelle di streaming usando un'istanza di SQL Warehouse. Per inviare istruzioni CREATE e REFRESH, usare l'editor SQL nell'interfaccia utente Azure Databricks, Databricks SQL CLI o l'API SQL Databricks SQL API.
È anche possibile creare e aggiornare viste materializzate autonome e tabelle di streaming da un notebook in esecuzione in un ambiente di calcolo generale serverless (beta, disponibilità a livello di area limitata). Vedere Notebook.
Requisiti generali
I requisiti seguenti si applicano a tutte le pipeline autonome.
Devi avere:
- Un account Azure Databricks con l'opzione serverless abilitata. Consultare Configurare i magazzini SQL serverless.
- Un'area di lavoro con il catalogo Unity abilitato. Consulta Introduzione al Catalogo Unity.
Autorizzazioni per creare o aggiornare
Il proprietario (l'utente che crea la tabella) deve disporre delle autorizzazioni seguenti:
-
SELECTprivilegio sulle tabelle di base. -
USE CATALOGeUSE SCHEMAprivilegi per il catalogo e lo schema contenenti le tabelle di origine. -
USE CATALOGeUSE SCHEMAprivilegi per il catalogo e lo schema di destinazione. -
CREATE MATERIALIZED VIEWprivilegio sullo schema contenente la vista materializzata. -
CREATE TABLEprivilegio sullo schema contenente la tabella di streaming. Anche le pipeline che usano la modalità legacy di pubblicazione richiedono anche il privilegioCREATE TABLEper le viste materializzate.
Per aggiornare una vista materializzata autonoma o una tabella di streaming:
- È necessario trovarsi nell'area di lavoro in cui è stato creato.
- È necessario avere il privilegio
REFRESHsulla tabella. I proprietari hanno questo privilegio in modo implicito.
Requisiti della tabella di origine
Per l'aggiornamento incrementale delle viste materializzate dalle tabelle Delta, è necessario che nelle tabelle di origine sia abilitato il rilevamento delle righe.
Magazzini SQL
Per creare o aggiornare viste materializzate autonome e tabelle di streaming tramite un SQL warehouse, è necessario disporre di un SQL warehouse Pro o serverless abilitato per Unity Catalog.
- L'area di lavoro deve trovarsi in una regione che supporta i warehouse SQL senza server.
Notebooks
È possibile creare e aggiornare viste materializzate autonome e tabelle di streaming da un notebook con calcolo generale serverless.
Calcolo generico serverless
Importante
La creazione e l'aggiornamento di viste materializzate autonome e tabelle di streaming da un notebook in un ambiente di calcolo generale serverless sono disponibili in Beta. Questa funzionalità è disponibile solo nelle aree selezionate. Vedere Disponibilità a livello di area.
È possibile creare e aggiornare viste materializzate autonome e tabelle di streaming da un notebook collegato al calcolo generale serverless. Questa opzione è utile quando si vogliono definire ed eseguire viste materializzate o tabelle di streaming insieme ad altri flussi di lavoro basati su notebook senza effettuare il provisioning di un'istanza di SQL Warehouse.
Requisiti generali di calcolo serverless
- Notebook collegato a un ambiente di calcolo generale serverless.
- Databricks Runtime 18.1 o versione successiva. I notebook interattivi soddisfano automaticamente questo requisito; i processi aggiunti a una versione precedente non lo fanno.
- L'area di lavoro deve trovarsi in un'area supportata.
Limitations
- Solo il proprietario della tabella può aggiornare la tabella. Per consentire a un altro utente di eseguire l'aggiornamento, modificare il proprietario. Vedere Modificare il proprietario di una tabella di streaming e Modificare il proprietario di una vista materializzata.
- Gli aggiornamenti asincroni non sono supportati. Usare invece un aggiornamento sincrono.
- Il canale di anteprima non è supportato. Le tabelle create nel calcolo generico serverless usano il canale
current. - Una tabella può essere aggiornata solo usando il tipo di calcolo con cui è stata creata. Una tabella creata su un SQL warehouse deve essere aggiornata su un SQL warehouse e una tabella creata su un ambiente di calcolo generico serverless deve essere aggiornata su un ambiente di calcolo generico serverless. Per controllare il tipo di calcolo, visualizzare la tabella in Esplora cataloghi.
- L'attribuzione e il controllo dei costi non sono disponibili. Usa un SQL warehouse se hai bisogno dell'attribuzione dei costi per tabella.
- La scalabilità automatica verticale in caso di errori di memoria insufficiente non è disponibile.
- I nuovi tentativi degli aggiornamenti dello schema non sono disponibili.
- La selezione della modalità prestazioni all'aggiornamento non è disponibile. Vedere Selezionare una modalità di prestazioni per gli aggiornamenti pianificati.
Note
spark.sql è supportato quando si esegue un aggiornamento in un notebook in un ambiente di calcolo generale serverless.
:::
Requisiti delle query
Per eseguire una query su una vista materializzata autonoma o su una tabella di streaming, è necessario esserne il proprietario oppure disporre di SELECT per la tabella, oltre che di USE CATALOG e USE SCHEMA per le relative tabelle padre.
È necessario usare una delle risorse di calcolo seguenti:
- Magazzino SQL
- Interfacce dei Pipeline dichiarative di Lakeflow Spark
- Calcolo in modalità di accesso standard (in precedenza modalità di accesso condiviso)
- Calcolo in modalità di accesso dedicato (in precedenza modalità accesso utente singolo) in Databricks Runtime 15.4 o versione successiva, se l'area di lavoro è abilitata per il calcolo serverless. Vedere Controllo di accesso con granularità fine in calcolo dedicato. Se si è il proprietario, è possibile usare il calcolo in modalità di accesso dedicato che esegue Databricks Runtime 14.3 o versione successiva.
Per le tabelle di streaming in Databricks Runtime 15.3 e versioni successive, è possibile usare risorse di calcolo dedicate per eseguire query su una tabella di streaming solo se è proprietaria. Databricks Runtime 15.4 LTS e versioni successive supportano l'esecuzione di query su tabelle generate dalla pipeline in calcolo dedicato anche se non si è il proprietario. È possibile che vengano addebitati costi per le risorse di calcolo serverless quando si usa un calcolo dedicato per eseguire operazioni di filtro dei dati. Vedere Controllo di accesso con granularità fine in calcolo dedicato.
Disponibilità a livello regionale
Le tabelle create e aggiornate tramite un warehouse SQL di Databricks sono disponibili in tutte le regioni che supportano i warehouse SQL serverless di Databricks.
La creazione e l'aggiornamento di viste materializzate autonome e tabelle di streaming in calcolo generale serverless sono disponibili solo nelle aree selezionate.
Per l'elenco delle aree supportate per entrambe le opzioni di calcolo, vedere Disponibilità serverless.