Condividi tramite


Impostazioni delle funzionalità del driver per il driver JDBC di Databricks

Questo articolo descrive come configurare impostazioni speciali e avanzate delle funzionalità del driver per il driver JDBC di Databricks.

Il driver JDBC di Databricks offre le impostazioni speciali e avanzate seguenti per le funzionalità del driver.

Supporto delle query ANSI SQL-92 in JDBC

I driver JDBC Spark legacy accettano query SQL in dialetto ANSI SQL-92 e convertono le query nel dialetto SQL di Databricks prima di inviarle al server. Tuttavia, se l'applicazione genera direttamente Databricks SQL o l'applicazione usa una sintassi SQL-92 standard non ANSI specifica per Azure Databricks, Databricks consiglia di impostare UseNativeQuery=1 come configurazione di connessione. Con questa impostazione, il driver passa le query SQL verbatim ad Azure Databricks.

Catalogo e schema predefiniti

Per specificare il catalogo e lo schema predefiniti, aggiungere ConnCatalog=<catalog-name>;ConnSchema=<schema-name> all'URL di connessione JDBC.

Estrarre risultati di query di grandi dimensioni in JDBC

Per ottenere prestazioni ottimali quando si estraggono risultati di query di grandi dimensioni, usare la versione più recente del driver JDBC, che include le ottimizzazioni seguenti.

Serializzazione freccia in JDBC

Il driver JDBC versione 2.6.16 e successive supporta un formato di serializzazione dei risultati delle query ottimizzato che usa Apache Arrow.

Recupero cloud in JDBC

Il driver JDBC versione 2.6.19 e successive supporta Cloud Fetch, una funzionalità che recupera i risultati delle query tramite l'archiviazione cloud configurata nella distribuzione di Azure Databricks.

I risultati delle query vengono caricati in un percorso di archiviazione DBFS interno come file serializzati con freccia fino a 20 MB. Quando il driver invia richieste di recupero dopo il completamento delle query, Azure Databricks genera e restituisce firme di accesso condiviso ai file caricati. Il driver JDBC usa quindi gli URL per scaricare i risultati direttamente da DBFS.

Il recupero cloud viene usato solo per i risultati delle query superiori a 1 MB. I risultati più piccoli vengono recuperati direttamente da Azure Databricks.

Azure Databricks esegue automaticamente il Garbage Collection dei file accumulati contrassegnati per l'eliminazione dopo 24 ore. Questi file contrassegnati vengono eliminati completamente dopo altre 24 ore.

Per altre informazioni sull'architettura di recupero cloud, vedere How We Achieved High Bandwidth Connessione ivity With BI Tools (Come ottenere una larghezza di banda elevata con gli strumenti di BUSINESS Intelligence).

Abilitazione della registrazione

Per abilitare la registrazione nel driver JDBC, impostare la LogLevel proprietà da 1 per registrare solo eventi gravi tramite 6 per registrare tutte le attività del driver. Impostare la LogPath proprietà sul percorso completo della cartella in cui si desidera salvare i file di log.

Per altre informazioni, vedere la Configuring Logging sezione nella Guida al driver JDBC di Databricks.