Nastavení možností ovladače pro ovladač Databricks JDBC

Článek
08/27/2024

Tento článek popisuje, jak nakonfigurovat speciální a pokročilé nastavení schopností ovladačů pro ovladač Databricks JDBC.

Ovladač Databricks JDBC poskytuje následující speciální a pokročilá nastavení možností ovladačů.

Podpora dotazů ANSI SQL-92 v JDBC
Výchozí katalog a schéma
Extrahování velkých výsledků dotazů v JDBC
Serializace šipky v JDBC
Načtení cloudu v JDBC
Povolení protokolování

Podpora dotazů ANSI SQL-92 v JDBC

Starší ovladače Spark JDBC přijímají dotazy SQL v dialektu ANSI SQL-92 a před jejich odesláním na server přeloží dotazy do dialektu SQL Databricks. Pokud ale vaše aplikace generuje Databricks SQL přímo nebo vaše aplikace používá jakoukoli jinou než ansi SQL-92 standardní syntaxi SQL specifickou pro Azure Databricks, databricks doporučuje nastavit UseNativeQuery=1 jako konfiguraci připojení. S tímto nastavením ovladač předá doslovné doslovné zpracování dotazů SQL do Azure Databricks.

Výchozí katalog a schéma

Chcete-li zadat výchozí katalog a schéma, přidejte ConnCatalog=<catalog-name>;ConnSchema=<schema-name> na adresu URL připojení JDBC.

Extrahování velkých výsledků dotazů v JDBC

Pokud chcete dosáhnout nejlepšího výkonu při extrahování velkých výsledků dotazů, použijte nejnovější verzi ovladače JDBC, která zahrnuje následující optimalizace.

Serializace šipky v JDBC

Ovladač JDBC verze 2.6.16 a vyšší podporuje optimalizovaný formát serializace výsledků dotazu, který používá Apache Arrow.

Načtení cloudu v JDBC

Ovladač JDBC verze 2.6.19 a vyšší podporuje cloudové načítání, schopnost, která načítá výsledky dotazů prostřednictvím cloudového úložiště, které je nastavené v nasazení Azure Databricks.

Výsledky dotazu se nahrají do interního umístění úložiště DBFS jako soubory serializované šipkami o velikosti až 20 MB. Když ovladač po dokončení dotazu odešle požadavky na načtení, Azure Databricks vygeneruje a vrátí sdílené přístupové podpisy do nahraných souborů. Ovladač JDBC pak pomocí adres URL stáhne výsledky přímo z DBFS.

Cloudové načítání se používá jenom pro výsledky dotazů větších než 1 MB. Menší výsledky se načítají přímo z Azure Databricks.

Azure Databricks automaticky uvolňování paměti shromažďuje kumulované soubory, které jsou označené k odstranění po 24 hodinách. Tyto označené soubory se po dalších 24 hodinách úplně odstraní.

Další informace o architektuře cloudového načítání najdete v tématu Jak jsme dosáhli připojení s nástroji BI s vysokou šířkou pásma.

Povolit protokolování

Chcete-li povolit protokolování v ovladači JDBC, nastavte LogLevel vlastnost z 1 protokolu pouze závažné události až 6 protokolovat všechny aktivity řidiče. LogPath Nastavte vlastnost na úplnou cestu ke složce, do které chcete ukládat soubory protokolu.

Další informace najdete Configuring Logging v části Průvodce ovladačem Databricks JDBC.

Sdílet prostřednictvím