Configurações de capacidade do driver para o driver ODBC do Databricks

Artigo
08/30/2024

Este artigo descreve como definir configurações de capacidade de driver especial e avançado para o driver ODBC Databricks.

O driver ODBC Databricks fornece as seguintes configurações especiais e avançadas de capacidade de driver.

Definir o esquema inicial no ODBC
Suporte a consultas ANSI SQL-92 em ODBC
Extrair resultados de consulta grandes no ODBC
Serialização de seta no ODBC
Cloud Fetch em ODBC
Ativar registo

Definir o esquema inicial no ODBC

O driver ODBC permite que você especifique o esquema definindo Schema=<schema-name> como uma configuração de conexão. Isso equivale a executar USE <schema-name>o .

Suporte a consultas ANSI SQL-92 em ODBC

O driver ODBC aceita consultas SQL no dialeto ANSI SQL-92 e traduz as consultas para o dialeto SQL Databricks. No entanto, se seu aplicativo gera Databricks SQL diretamente ou seu aplicativo usa qualquer sintaxe SQL padrão não-ANSI SQL-92 específica para o Azure Databricks, o Databricks recomenda que você defina UseNativeQuery=1 como uma configuração de conexão. Com essa configuração, o driver passa as consultas SQL literalmente para o Azure Databricks.

Extrair resultados de consulta grandes no ODBC

Para obter o melhor desempenho ao extrair resultados de consulta grandes, use a versão mais recente do driver ODBC que inclui as seguintes otimizações.

Serialização de seta no ODBC

O driver ODBC versão 2.6.15 e superior suporta um formato de serialização de resultados de consulta otimizado que usa a Seta Apache.

Cloud Fetch em ODBC

O Driver ODBC versão 2.6.17 e superior oferece suporte ao Cloud Fetch, um recurso que busca resultados de consulta por meio do armazenamento em nuvem configurado em sua implantação do Azure Databricks.

Os resultados da consulta são carregados em um local de armazenamento DBFS interno como arquivos serializados por seta de até 20 MB. Quando o driver envia solicitações de busca após a conclusão da consulta, o Azure Databricks gera e retorna assinaturas de acesso compartilhado para os arquivos carregados . Em seguida, o driver ODBC usa as URLs para baixar os resultados diretamente do DBFS.

O Cloud Fetch só é utilizado para resultados de consultas superiores a 1 MB. Resultados menores são recuperados diretamente do Azure Databricks.

O Azure Databricks coleta automaticamente os arquivos acumulados que são marcados para exclusão após 24 horas. Esses arquivos marcados são completamente excluídos após mais 24 horas.

Para saber mais sobre a arquitetura Cloud Fetch, consulte Como conseguimos conectividade de alta largura de banda com ferramentas de BI.

Ativar registo

Para habilitar o registro em log no driver ODBC para Windows, defina os seguintes campos no Administrador de Fonte de Dados ODBC para o DSN relacionado:

Defina o campo Nível de Log de FATAL para registrar somente eventos graves através de TRACE para registrar todas as atividades do driver.
Defina o campo Caminho do Log como o caminho completo para a pasta onde deseja salvar os arquivos de log.
Defina o campo Número máximo de arquivos para o número máximo de arquivos de log a serem mantidos.
Defina o campo Tamanho máximo do arquivo para o tamanho máximo de cada arquivo de log em megabytes.

Para habilitar o registro no driver ODBC para uma máquina que não seja Windows, defina as seguintes propriedades na cadeia de conexão DSN ou sem DSN relacionada:

Defina a propriedade de para registrar somente eventos graves para 6 registrar toda a LogLevel atividade do 1 driver.
Defina a LogPath propriedade como o caminho completo para a pasta onde você deseja salvar os arquivos de log.
Defina a LogFileCount propriedade para o número máximo de arquivos de log a serem mantidos.
Defina a LogFileSize propriedade para o tamanho máximo de cada arquivo de log em bytes.

Para obter mais informações, consulte as seções Configuring Logging Options on Windows e Configuring Logging Options on a Non-Windows Machine no Guia do driver JDBC do Databricks.

Partilhar via