Поделиться через


Параметры возможностей драйвера для драйвера ODBC Databricks

В этой статье описывается настройка специальных и расширенных параметров возможностей драйвера для драйвера ODBC Databricks.

Драйвер ODBC Datbricks предоставляет следующие специальные и расширенные параметры возможностей драйвера.

Установка исходной схемы в ODBC

Драйвер ODBC позволяет указать схему, задав для параметра Schema=<schema-name> конфигурацию соединения. Это эквивалентно инструкции USE <schema-name>.

Поддержка запросов ANSI SQL-92 в ODBC

Драйвер ODBC принимает запросы SQL в диалекте ANSI SQL-92 и преобразует их в диалект Databricks SQL. Однако если приложение создает Databricks SQL напрямую или использует какой-либо стандартный синтаксис SQL-92, отличный от ANSI и характерный для Azure Databricks, то Databricks рекомендует установить UseNativeQuery=1 в качестве параметра соединения. С этим параметром драйвер передает запросы SQL в Azure Databricks в буквальном виде.

Извлечение результатов больших запросов в ODBC

Для достижения максимальной производительности при извлечении объемных результатов запроса используйте последнюю версию драйвера ODBC, которая включает перечисленные ниже оптимизации.

Сериализация со стрелками в ODBC

Драйвер ODBC версии 2.6.15 и выше поддерживает оптимизированный формат сериализации результатов запросов, использующий Apache Arrow.

Облачная выборка в ODBC

Драйвер ODBC версии 2.6.17 и выше поддерживает Cloud Fetch, возможность получения результатов запросов через облачное хранилище, настроенное в развертывании Azure Databricks.

Результаты запроса передаются во внутреннее расположение в хранилище DBFS в виде сериализованных файлов Arrow размером до 20 МБ. Когда драйвер отправляет запросы на получение после завершения запроса, Azure Databricks создает и возвращает подписанные URL-адреса для переданных файлов. Затем драйвер ODBC использует URL-адреса для скачивания результатов непосредственно из DBFS.

Облачная выборка используется только для результатов запроса, размер которых превышает 1 МБ. Результаты меньшего размера извлекаются непосредственно из Azure Databricks.

Azure Databricks автоматически выполняет сборку мусора накопленных файлов, которые отмечаются для удаления через 24 часа. Эти помеченные файлы полностью удаляются еще через 24 часа.

Дополнительные сведения об архитектуре облачной выборки см. в разделе Как обеспечить подключение с высокой пропускной способностью с помощью средств бизнес-аналитики.

Включение ведения журналов

Чтобы включить ведение журнала в драйвере ODBC для Windows, задайте следующие поля в администраторе источника данных ODBC для связанного DSN:

  • Задайте для поля "Уровень журнала" значение FATAL, чтобы регистрировать только серьезные события с помощью TRACE, чтобы регистрировать все действия драйвера.
  • Задайте полную папку пути к журналу, в которой требуется сохранить файлы журналов.
  • Задайте для поля Max Number Files максимальное количество файлов журнала.
  • Задайте для поля Max File Size максимальный размер каждого файла журнала в мегабайтах.

Чтобы включить ведение журнала в драйвере ODBC для компьютера, отличного от Windows, задайте следующие свойства в связанных строка подключения DSN или DSN:

  • LogLevel Задайте свойство из 1 журнала только тяжелых событий6, чтобы регистрировать все действия драйвера.
  • LogPath Задайте свойству полный путь к папке, в которой требуется сохранить файлы журнала.
  • LogFileCount Задайте для свойства максимальное количество сохраняемых файлов журналов.
  • LogFileSize Задайте для свойства максимальный размер каждого файла журнала в байтах.

Дополнительные сведения см. в разделах Configuring Logging Options on Windows и Configuring Logging Options on a Non-Windows Machine в руководстве по драйверу JDBC Databricks.