Tipi di sql warehouse

Databricks SQL supporta i tipi di SQL Warehouse seguenti:

  • Senza server
  • Pro
  • Classico

Ogni tipo di sql warehouse ha funzionalità di prestazioni diverse. La tabella seguente illustra le funzionalità delle prestazioni supportate da ogni tipo di sql warehouse.

Motore Photon I/O predittivo Gestione del carico di lavoro intelligente
Senza server X X X
Pro X X
Classico X

L'elenco seguente descrive ogni funzionalità delle prestazioni:

  • Photon: motore di query vettorializzato nativo in Databricks. Rende le chiamate API SQL e DataFrame esistenti più veloci e riduce il costo totale per ogni carico di lavoro.

  • I/O predittivo: una suite di funzionalità per velocizzare le operazioni di analisi selettiva nelle query SQL. Le operazioni di I/O predittive possono offrire un'ampia gamma di velocità.

  • Gestione intelligente dei carichi di lavoro (IWM): set di funzionalità che migliorano la capacità di SQL Serverless di Databricks di elaborare un numero elevato di query in modo rapido e conveniente. Usando le tecniche di previsione e gestione dinamica basate sull'intelligenza artificiale, IWM garantisce che i carichi di lavoro abbiano rapidamente la giusta quantità di risorse. La differenza principale consiste nelle funzionalità di intelligenza artificiale in Databricks SQL per rispondere in modo dinamico alle richieste del carico di lavoro anziché usare soglie statiche.

    Nota

    Per i prezzi per ogni tipo di warehouse e un confronto dettagliato delle funzionalità, vedere Databricks SQL. Per informazioni sulle funzionalità più recenti di Databricks SQL, vedere Note sulla versione di Databricks SQL.

Differenze di prestazioni tra i tipi di SQL Warehouse

Ogni tipo di sql warehouse presenta caratteristiche di prestazioni diverse.

Serverless SQL Warehouse

Usando l'architettura serverless di Azure Databricks, sql warehouse serverless supporta tutte le funzionalità di prestazioni di Databricks SQL. Con un serverless SQL Warehouse e le relative funzionalità di prestazioni, è possibile ottenere:

  • Tempo di avvio rapido (in genere compreso tra 2 e 6 secondi).
  • Scalabilità rapida per acquisire più calcolo quando necessario per mantenere bassa latenza.
  • Ammissione di query più vicina alla limitazione dell'hardware anziché alla macchina virtuale.
  • Ridimensionamento rapido per ridurre al minimo i costi quando la domanda è bassa, offrendo prestazioni coerenti con costi e risorse ottimizzati.

Per prestazioni di avvio ottimali, I/O più efficiente, gestione più intelligente della domanda di query che varia notevolmente nel tempo e scalabilità automatica rapida quando si verifica l'accodamento delle query, scegliere un serverless SQL Warehouse. Vedere Ridimensionamento automatico serverless e accodamento delle query.

Un serverless SQL Warehouse offre prestazioni elevate con questi tipi di carichi di lavoro:

  • ETL
  • Business Intelligence
  • Analisi esplorativa

Importante

I warehouse SQL non supportano il pass-through delle credenziali. Databricks consiglia di usare Unity Catalog per la governance dei dati. Vedere Cos'è Unity Catalog?.

Pro SQL Warehouse

Un pro SQL Warehouse supporta Photon e I/O predittivo, ma non supporta la gestione intelligente del carico di lavoro. Con un pro SQL Warehouse (a differenza di un serverless SQL Warehouse), il livello di calcolo esiste nell'account di sottoscrizione di Azure anziché nell'account Azure Databricks. Di conseguenza, un pro SQL Warehouse non supporta la gestione intelligente del carico di lavoro, rendendolo meno reattivo alla domanda di query che varia notevolmente nel tempo e non è in grado di ridimensionare automaticamente il più rapidamente possibile come un serverless SQL Warehouse. L'avvio di un pro SQL Warehouse richiede alcuni minuti (in genere circa 4 minuti) e aumenta e riduce la velocità di risposta rispetto a un serverless SQL Warehouse. Vedere Accodamento e scalabilità automatica per i data warehouse SQL classici e pro.

Usare un pro SQL Warehouse quando:

  • I warehouse SQL serverless non sono disponibili in un'area.
  • È disponibile una rete personalizzata e si vuole connettersi ai database nella rete nel cloud o in locale per la federazione o un'architettura di tipo ibrido. Ad esempio, usare un pro SQL Warehouse se si vogliono inserire altri servizi nella rete, ad esempio un bus di eventi o database, oppure si vuole connettere la rete alla rete locale.

Sql Warehouse classici

Un'istanza classica di SQL Warehouse supporta Photon, ma non supporta la gestione predittiva di I/O o del carico di lavoro intelligente. Con un sql warehouse classico (a differenza di un serverless SQL Warehouse), il livello di calcolo esiste nell'account di sottoscrizione di Azure anziché nell'account Azure Databricks. Senza il supporto per la gestione predittiva di I/O o di carico di lavoro intelligente, un sql warehouse classico offre solo prestazioni di livello di base e prestazioni inferiori rispetto a un serverless o a un data warehouse pro SQL. L'avvio di un'istanza classica di SQL Warehouse richiede anche alcuni minuti (in genere circa 4 minuti) e aumenta e riduce la velocità di risposta rispetto a un serverless SQL Warehouse. Vedere Accodamento e scalabilità automatica per i data warehouse SQL classici e pro.

Usare un sql warehouse classico per eseguire query interattive per l'esplorazione dei dati con le prestazioni di livello generale e le funzionalità SQL di Databricks.

Nota

Per informazioni sul ridimensionamento di SQL Warehouse e sulla scalabilità del data warehouse SQL in risposta all'accodamento delle query, vedere Accodamento e scalabilità automatica per i data warehouse SQL pro e classici.

Quali sono le impostazioni predefinite per il tipo di magazzino?

Per le aree di lavoro nelle aree che supportano i warehouse SQL serverless e soddisfano i requisiti:

  • Usando l'interfaccia utente, il tipo di data warehouse SQL predefinito è serverless.
  • Usando l'API SQL Warehouses con parametri predefiniti, il tipo di warehouse SQL predefinito è classico. Per usare serverless, impostare il enable_serverless_compute parametro true su e impostare anche su prowarehouse_type . Se questa area di lavoro usa l'API sql warehouse per creare un warehouse tra il 1° novembre 2022 e il 19 maggio 2023 e soddisfa i requisiti per i warehouse SQL serverless, l'impostazione predefinita rimane impostata su true. Per evitare ambiguità, in particolare per le organizzazioni con molte aree di lavoro, Databricks consiglia di impostare sempre questo campo.
  • Se l'area di lavoro usa un metastore Hive esterno legacy, i warehouse SQL serverless non sono supportati. Il tipo di sql warehouse predefinito è uguale a se il calcolo serverless fosse disabilitato, che è pro nell'interfaccia utente e nella versione classica usando l'API. Per altre informazioni su Unity Catalog o altre opzioni, contattare anche il team dell'account di Azure Databricks.

Per le aree di lavoro che non supportano i warehouse SQL serverless:

  • Usando l'interfaccia utente, il tipo di sql warehouse predefinito è pro.
  • Usando l'API SQL Warehouses con parametri predefiniti, il tipo di warehouse SQL predefinito è classico.