Informazioni sulle funzionalità e sui casi d'uso del pool SQL serverless di Azure Synapse
Azure Synapse Analytics è un servizio di analisi integrato che riunisce un'ampia gamma di tecnologie comunemente usate per l'elaborazione e l'analisi dei dati su larga scala. Una delle tecnologie più diffuse usate nelle soluzioni dati è SQL: un linguaggio standard del settore per l'esecuzione di query e la modifica dei dati.
Pool SQL serverless in Azure Synapse Analytics
Azure Synapse SQL è un sistema di query distribuito in Azure Synapse Analytics che offre due tipi di ambienti di runtime:
- pool SQL serverless: elaborazione di query SQL su richiesta, usata principalmente per lavorare con i dati in un data lake.
- pool SQL dedicato: istanze di database relazionali su scala aziendale usate per ospitare data warehouse in cui i dati vengono archiviati in tabelle relazionali.
In questo modulo verrà illustrato il pool SQL serverless, che fornisce un endpoint con pagamento in base alla query per eseguire query sui dati nel data lake. I vantaggi dell'uso del pool SQL serverless includono:
- Una sintassi Transact-SQL familiare per eseguire query sui dati senza la necessità di copiare o caricare dati in un archivio specializzato.
- Connettività integrata da un'ampia gamma di strumenti di business intelligence e query ad hoc, inclusi i driver più diffusi.
- Elaborazione di query distribuite compilata per dati su larga scala e funzioni di calcolo, con prestazioni di query veloci.
- Tolleranza di errore predefinita per l'esecuzione di query, con conseguente elevata affidabilità e frequenza di esito positivo anche per query con esecuzione prolungata che coinvolgono set di dati di grandi dimensioni.
- Nessuna infrastruttura da configurare o cluster da gestire. Un endpoint predefinito per questo servizio viene fornito all'interno di ogni area di lavoro di Azure Synapse, quindi è possibile iniziare a eseguire query sui dati non appena viene creata l'area di lavoro.
- Nessun addebito per le risorse riservate, vengono addebitati solo i dati elaborati dalle query eseguite.
Quando usare pool SQL serverless
Il pool SQL serverless è personalizzato per eseguire query sui dati che risiedono nel data lake, quindi, oltre a eliminare il carico di gestione, elimina la necessità di inserire i dati nel sistema. È sufficiente puntare la query ai dati già presenti nel lake ed eseguirli.
Il modello di risorse serverless di Synapse SQL è ideale per carichi di lavoro non pianificati o "bursty" che possono essere elaborati usando l'endpoint SQL serverless always-on nell'area di lavoro di Azure Synapse Analytics. L'uso del pool serverless consente di conoscere i costi esatti per ogni query eseguita per monitorare e attribuire i costi.
Nota
Il pool SQL serverless è un sistema di analisi e non è consigliato per carichi di lavoro OLTP, ad esempio i database usati dalle applicazioni per archiviare i dati transazionali. I carichi di lavoro che richiedono tempi di risposta in millisecondi e cercano di individuare una singola riga in un set di dati non sono adatti per il pool SQL serverless.
I casi d'uso comuni per i pool SQL serverless includono:
- 'esplorazione dei dati: l'esplorazione dei dati implica l'esplorazione del data lake per ottenere informazioni iniziali sui dati ed è facilmente raggiungibile con Azure Synapse Studio. È possibile esplorare i file in Data Lake Storage collegato e usare il pool SQL serverless predefinito per generare automaticamente uno script SQL per selezionare le PRIME 100 righe da un file o una cartella esattamente come si farebbe con una tabella in SQL Server. Da qui è possibile applicare proiezioni, filtri, raggruppamenti e la maggior parte dell'operazione sui dati come se i dati fossero in una normale tabella di SQL Server.
- trasformazione dei dati: mentre Azure Synapse Analytics offre ottime funzionalità di trasformazione dei dati con Synapse Spark, alcuni data engineer potrebbero trovare la trasformazione dei dati più semplice da ottenere usando SQL. Il pool SQL serverless consente di eseguire trasformazioni dei dati basate su SQL; in modo interattivo o come parte di una pipeline di dati automatizzata.
- data warehouse logico: dopo l'esplorazione iniziale dei dati nel data lake, è possibile definire oggetti esterni come tabelle e viste in un database SQL serverless. I dati rimangono archiviati nei file data lake, ma vengono astratti da uno schema relazionale che può essere usato dalle applicazioni client e dagli strumenti analitici per eseguire query sui dati come in un database relazionale ospitato in SQL Server.