Поделиться через


Подключение к каталогу Unity Azure Databricks и управление ими в Microsoft Purview (предварительная версия)

В этой статье описано, как зарегистрировать Azure Databricks, а также как выполнять проверку подлинности и взаимодействовать с каталогом Unity Azure Databricks в Microsoft Purview. Дополнительные сведения о Microsoft Purview см. в вводной статье.

Важно!

Сейчас эта функция доступна в предварительной версии. Дополнительные условия использования предварительных версий Microsoft Azure включают дополнительные юридические условия, применимые к функциям Azure, которые находятся в бета-версии, в предварительной версии или еще не выпущены в общедоступной версии.

Поддерживаемые возможности

Извлечение метаданных Полная проверка Добавочное сканирование Сканирование с заданной областью Классификация Присвоение подписей Политика доступа Линии Общий доступ к данным Динамическое представление
Да Да Нет Да Нет Нет Нет Нет Нет Нет

При сканировании каталога Azure Databricks Unity Microsoft Purview поддерживает:

  • Хранилище метаданных
  • Каталоги
  • Схемы
  • Таблицы, включая столбцы
  • Представления, включая столбцы

При настройке проверки можно выбрать сканирование всего каталога Unity или область сканирование в подмножество каталогов.

Примечание.

Этот соединитель приносит метаданные из каталога Unity Azure Databricks. Чтобы проверить метаданные области рабочей области Azure Databricks, обратитесь к соединителю хранилища метаданных Hive Для Azure Databricks.

Известные ограничения

  • В настоящее время проверка не поддерживается, если рабочая область Azure Databricks не разрешает доступ из общедоступной сети или если учетная запись Purview не включает доступ из всех сетей. Вскоре мы добавим эту поддержку.
  • При удалении объекта из источника данных в настоящее время при последующей проверке соответствующий ресурс в Microsoft Purview автоматически не удаляется.

Предварительные требования

Регистрация

В этом разделе описывается, как зарегистрировать рабочую область Azure Databricks в Microsoft Purview с помощью портала управления Microsoft Purview.

  1. Перейдите к учетной записи Microsoft Purview.

  2. Выберите Карта данных в левой области.

  3. Нажмите Зарегистрировать.

  4. В разделе Регистрация источников выберите Azure Databricks>Continue.

  5. На экране Регистрация источников (Azure Databricks) выполните следующие действия.

    1. В поле Имя введите имя, которое Microsoft Purview будет отображать в качестве источника данных.

    2. В полях Подписка Azure и Имя рабочей области Databricks выберите подписку и рабочую область, которые нужно проверить, в раскрывающемся списке. URL-адрес рабочей области Databricks заполняется автоматически.

    3. В поле Выберите коллекцию выберите коллекцию из списка или создайте новую. Это действие необязательно.

    Снимок экрана: регистрация источника Azure Databricks.

  6. Нажмите Готово.

Проверка

Совет

Чтобы устранить неполадки со сканированием, выполните указанные ниже действия.

  1. Убедитесь, что выполнены все предварительные требования.
  2. Ознакомьтесь с нашей документацией по устранению неполадок сканирования.

Выполните следующие действия, чтобы проверить Azure Databricks для автоматической идентификации ресурсов. Дополнительные сведения о сканировании в целом см. в статье Сканирование и прием данных в Microsoft Purview.

  1. Перейдите в раздел Источники.

  2. Выберите зарегистрированный объект Azure Databricks.

  3. Выберите + Создать сканирование.

  4. Укажите следующие сведения.

    1. Имя. Введите имя проверки.

    2. Метод извлечения: Указывает на извлечение метаданных из хранилища метаданных Hive или каталога Unity. Выберите Каталог Unity.

    3. Подключение через среду выполнения интеграции. Выберите среду выполнения интеграции с автоматическим разрешением по умолчанию.

    4. Учетные данные. Выберите учетные данные для подключения к источнику данных. Убедитесь, что:

      • Выберите Проверка подлинности маркера доступа при создании учетных данных.
      • Укажите имя секрета личного маркера доступа, созданного в разделе Предварительные требования , в соответствующем поле.

      Дополнительные сведения см. в разделе Учетные данные для проверки подлинности источника в Microsoft Purview.

    5. Путь HTTP: Укажите HTTP-путь Databricks SQL Warehouse, к которому будет подключаться Microsoft Purview, и выполните проверку, например /sql/1.0/endpoints/xxxxxxxxxxxxxxxx. Его можно найти в рабочей области Azure Databricks —> хранилища SQL — хранилище —>> сведения о подключении —> путь HTTP.

  5. Щелкните Проверить подключение , чтобы проверить параметры.

    Снимок экрана: настройка проверки каталога Unity в Azure Databricks.

  6. Нажмите Продолжить.

  7. На странице Область сканирования выберите каталоги, которые нужно проверить.

    Снимок экрана: настройка область для проверки Azure Databricks.

  8. В поле Триггер сканирования укажите, следует ли настроить расписание или запустить проверку один раз.

  9. Просмотрите проверку и выберите Сохранить и запустить.

После успешного завершения сканирования узнайте, как просматривать и искать ресурсы.

Просмотр проверок и запусков сканирования

Чтобы просмотреть существующие проверки, выполните приведенные далее действия.

  1. Перейдите на портал управления Microsoft Purview. В левой области выберите Карта данных.
  2. Выберите источник данных. Список существующих проверок для этого источника данных можно просмотреть в разделе Последние проверки или просмотреть все проверки на вкладке Сканирование .
  3. Выберите сканирование с результатами, которые вы хотите просмотреть. На панели отображаются все предыдущие запуски сканирования, а также состояние и метрики для каждого запуска сканирования.
  4. Выберите идентификатор запуска, чтобы проверка сведения о выполнении проверки.

Управление проверками

Чтобы изменить, отменить или удалить сканирование:

  1. Перейдите на портал управления Microsoft Purview. В левой области выберите Карта данных.

  2. Выберите источник данных. Список существующих проверок для этого источника данных можно просмотреть в разделе Последние проверки или просмотреть все проверки на вкладке Сканирование .

  3. Выберите проверку, которой вы хотите управлять. Далее вы можете:

    • Измените сканирование, выбрав Изменить проверку.
    • Отмените выполняемую проверку, выбрав Отмена выполнения проверки.
    • Удалите сканирование, выбрав Удалить сканирование.

Примечание.

  • При удалении сканирования ресурсы каталога, созданные на основе предыдущих проверок, не удаляются.
  • Ресурс больше не будет обновляться с изменениями схемы, если исходная таблица изменилась и вы повторно просканируете исходную таблицу после изменения описания на вкладке Схема Microsoft Purview.

Обзор и поиск ресурсов

После сканирования Azure Databricks можно просмотреть каталог данных или выполнить поиск в каталоге данных , чтобы просмотреть сведения об активе.

При просмотре по типам источников вы увидите две записи для каталога Unity Azure Databricks и Azure Databricks соответственно. Первый содержит артефакты каталога Unity, включая хранилище метаданных и его каталоги,схемы/таблицы/представления, а второй содержит рабочую область.

Снимок экрана: просмотр ресурсов по типу источника.

В ресурсе рабочей области Azure Databricks на вкладке Свойства можно найти связанный каталог Unity.

Снимок экрана: поиск связанного каталога Unity с источником Azure Databricks.

Дальнейшие действия

Теперь, когда вы зарегистрировали источник, используйте следующие руководства, чтобы узнать больше о Microsoft Purview и ваших данных: