Подключение к Preset
Preset предоставляет современную бизнес-аналитику для всей организации. Preset обеспечивает мощную, простую в использовании платформу изучения и визуализации данных на базе Apache Superset с открытым кодом.
Вы можете интегрировать хранилища Databricks SQL (прежнее название — конечные точки Databricks SQL) и кластеры Azure Databricks с Preset.
Подключение к Preset с помощью Partner Connect
Чтобы подключить рабочую область Azure Databricks к предварительной настройке с помощью Partner Connect, см. статью "Подключение к партнерам бизнес-аналитики" с помощью Partner Connect.
Примечание.
Partner Connect поддерживает только хранилища Databricks SQL для Preset. Чтобы подключить кластер в рабочей области Azure Databricks к Preset, подключитесь к Preset вручную.
Подключение к Preset вручную
В этом разделе показано, как вручную подключить существующее хранилище SQL или кластер в рабочей области Azure Databricks к Preset.
Примечание.
Для хранилищ SQL вы можете использовать Partner Connect, чтобы упростить процесс подключения.
Требования
Прежде чем выполнить интеграцию с Preset вручную, необходимо получить следующее:
Кластер хранилища SQL в рабочей области Azure Databricks.
- Справочник по конфигурации вычислений.
- Создание хранилища SQL.
Сведения о подключении для кластера или хранилища SQL, в частности имя узла сервера, порт и путь HTTP.
- Получение сведений о подключении для вычислительного ресурса Azure Databricks.
Маркер личного доступа Azure Databricks или токен Microsoft Entra ID (ранее Azure Active Directory). Чтобы создать личный маркер доступа, сделайте следующее:
- В рабочей области Azure Databricks щелкните имя пользователя Azure Databricks в верхней строке и выберите "Параметры " в раскрывающемся списке.
- Щелкните "Разработчик".
- Рядом с маркерами доступа нажмите кнопку "Управление".
- Щелкните Generate new token (Создание нового маркера).
- (Необязательно) Введите комментарий, который поможет определить этот маркер в будущем и изменить время существования маркера по умолчанию в течение 90 дней. Чтобы создать маркер без времени существования (не рекомендуется), оставьте поле время существования (дни) пустым (пустым).
- Щелкните Создать.
- Скопируйте отображаемый маркер в безопасное расположение и нажмите кнопку "Готово".
Примечание.
Не забудьте сохранить скопированный маркер в безопасном расположении. Не делитесь скопированным маркером с другими пользователями. Если вы потеряете скопированный маркер, вы не сможете повторно создать тот же маркер. Вместо этого необходимо повторить эту процедуру, чтобы создать новый маркер. Если вы потеряете скопированный маркер или считаете, что маркер скомпрометирован, Databricks настоятельно рекомендует немедленно удалить этот маркер из рабочей области, щелкнув значок корзины (отозвать) рядом с маркером на странице маркеров доступа.
Если вы не можете создавать или использовать маркеры в рабочей области, это может быть связано с тем, что администратор рабочей области отключил маркеры или не предоставил вам разрешение на создание или использование маркеров. Ознакомьтесь с администратором рабочей области или следующими разделами:
Примечание.
В качестве рекомендации по обеспечению безопасности при проверке подлинности с помощью автоматизированных средств, систем, сценариев и приложений Databricks рекомендуется использовать личные маркеры доступа, принадлежащие субъектам-службам, а не пользователям рабочей области. Сведения о создании маркеров для субъектов-служб см. в разделе "Управление маркерами" для субъекта-службы.
Действия по подключению
Чтобы подключиться к Preset вручную, выполните следующие действия:
Нажмите + Рабочая область.
В диалоговом окне Добавление новой рабочей области введите имя рабочей области, выберите ближайший к вам регион рабочей области и нажмите кнопку Сохранить.
Откройте рабочую область, щелкнув плитку рабочей области.
На панели инструментов щелкните "Базы данных каталога>".
Щелкните + База данных.
В диалоговом окне Подключение базы данных в списке Поддерживаемые базы данных выберите один из следующих вариантов.
- Если используется хранилище SQL, выберите Хранилище Databricks SQL.
- Для кластера выберите Интерактивный кластер Databricks.
В поле URI SQLAlchemy введите следующее значение:
Для хранилища SQL:
databricks+pyodbc://token:{access token}@{server hostname}:{port}/{database name}
Для кластера:
databricks+pyhive://token:{access token}@{server hostname}:{port}/{database name}
Замена:
{access token}
на значение личного маркера доступа Azure Databricks<!– или значение маркера Azure Active Directory –> из требований.{server hostname}
на значение имени узла сервера из требований.{port}
на значение порта из требований.{database name}
на имя целевой базы данных в рабочей области Azure Databricks.
Например, для хранилища SQL:
databricks+pyodbc://token:dapi...@adb-1234567890123456.7.azuredatabricks.net:443/default
Например, для кластера:
databricks+pyhive://token:dapi...@adb-1234567890123456.7.azuredatabricks.net:443/default
Перейдите на вкладку Дополнительно и разверните пункт Другое.
В поле Параметры подсистемы введите следующее значение:
Для хранилища SQL:
{"connect_args": {"http_path": "sql/1.0/warehouses/****", "driver_path": "/opt/simba/spark/lib/64/libsparkodbc_sb64.so"}}
Для кластера:
{"connect_args": {"http_path": "sql/protocolv1/o/****"}}
Замените
sql/protocolv1/o/****
значением в поле Путь HTTP из требований.Например, для хранилища SQL:
{"connect_args": {"http_path": "sql/1.0/warehouses/ab12345cd678e901", "driver_path": "/opt/simba/spark/lib/64/libsparkodbc_sb64.so"}}
Например, для кластера:
{"connect_args": {"http_path": "sql/protocolv1/o/1234567890123456/1234-567890-buyer123"}}
Перейдите на вкладку Основные и нажмите кнопку Проверить подключение.
Примечание.
Сведения об устранении неполадок с подключением см. в пошаговом руководстве по подключению к базе данных для Databricks на веб-сайте Preset.
После успешного соединения щелкните Подключить.
Следующие шаги
Ознакомьтесь со следующими ресурсами на веб-сайте Preset: