Nastavení možností ovladače pro ovladač Databricks JDBC
Tento článek popisuje, jak nakonfigurovat speciální a pokročilé nastavení schopností ovladačů pro ovladač Databricks JDBC.
Ovladač Databricks JDBC poskytuje následující speciální a pokročilá nastavení možností ovladačů.
- Podpora dotazů ANSI SQL-92 v JDBC
- Výchozí katalog a schéma
- Extrahování velkých výsledků dotazů v JDBC
- Serializace šipky v JDBC
- Načtení cloudu v JDBC
- Povolení protokolování
Podpora dotazů ANSI SQL-92 v JDBC
Starší ovladače Spark JDBC přijímají dotazy SQL v dialektu ANSI SQL-92 a před jejich odesláním na server přeloží dotazy do dialektu SQL Databricks. Pokud ale vaše aplikace generuje Databricks SQL přímo nebo vaše aplikace používá jakoukoli jinou než ansi SQL-92 standardní syntaxi SQL specifickou pro Azure Databricks, databricks doporučuje nastavit UseNativeQuery=1
jako konfiguraci připojení. S tímto nastavením ovladač předá doslovné doslovné zpracování dotazů SQL do Azure Databricks.
Výchozí katalog a schéma
Chcete-li zadat výchozí katalog a schéma, přidejte ConnCatalog=<catalog-name>;ConnSchema=<schema-name>
na adresu URL připojení JDBC.
Extrahování velkých výsledků dotazů v JDBC
Pokud chcete dosáhnout nejlepšího výkonu při extrahování velkých výsledků dotazů, použijte nejnovější verzi ovladače JDBC, která zahrnuje následující optimalizace.
Serializace šipky v JDBC
Ovladač JDBC verze 2.6.16 a vyšší podporuje optimalizovaný formát serializace výsledků dotazu, který používá Apache Arrow.
Načtení cloudu v JDBC
Ovladač JDBC verze 2.6.19 a vyšší podporuje cloudové načítání, schopnost, která načítá výsledky dotazů prostřednictvím cloudového úložiště, které je nastavené v nasazení Azure Databricks.
Výsledky dotazu se nahrají do interního umístění úložiště DBFS jako soubory serializované šipkami o velikosti až 20 MB. Když ovladač po dokončení dotazu odešle požadavky na načtení, Azure Databricks vygeneruje a vrátí sdílené přístupové podpisy do nahraných souborů. Ovladač JDBC pak pomocí adres URL stáhne výsledky přímo z DBFS.
Cloudové načítání se používá jenom pro výsledky dotazů větších než 1 MB. Menší výsledky se načítají přímo z Azure Databricks.
Azure Databricks automaticky uvolňování paměti shromažďuje kumulované soubory, které jsou označené k odstranění po 24 hodinách. Tyto označené soubory se po dalších 24 hodinách úplně odstraní.
Další informace o architektuře cloudového načítání najdete v tématu Jak jsme dosáhli připojení s nástroji BI s vysokou šířkou pásma.
Povolit protokolování
Chcete-li povolit protokolování v ovladači JDBC, nastavte LogLevel
vlastnost z 1
protokolu pouze závažné události až 6
protokolovat všechny aktivity řidiče. LogPath
Nastavte vlastnost na úplnou cestu ke složce, do které chcete ukládat soubory protokolu.
Další informace najdete Configuring Logging
v části Průvodce ovladačem Databricks JDBC.