Подключение к Azure Data Lake 1-го поколения в Microsoft Purview
В этой статье описывается процесс регистрации источника данных Azure Data Lake Storage 1-го поколения в Microsoft Purview, включая инструкции по проверке подлинности и взаимодействию с источником Azure Data Lake Storage 1-го поколения.
Примечание.
Azure Data Lake Storage 2-го поколения теперь общедоступна. Рекомендуется начать использовать его уже сегодня. Дополнительные сведения см. на странице продукта.
Поддерживаемые возможности
Извлечение метаданных | Полная проверка | Добавочное сканирование | Сканирование с заданной областью | Классификация | Присвоение подписей | Политика доступа | Линии | Общий доступ к данным | Динамическое представление |
---|---|---|---|---|---|---|---|---|---|
Да | Да | Да | Да | Да | Да | Нет | Ограниченное** | Нет | Нет |
** Происхождение данных поддерживается, если набор данных используется в качестве источника или приемника в Фабрике данных действие Copy
Предварительные требования
Учетная запись Azure с активной подпиской. Создайте учетную запись бесплатно.
Активная учетная запись Microsoft Purview.
Чтобы зарегистрировать источник и управлять им на портале управления Microsoft Purview, необходимо быть администратором источников данных и читателем данных. Дополнительные сведения см. на странице разрешений Microsoft Purview .
Регистрация
В этом разделе вы сможете зарегистрировать источник данных ADLS 1-го поколения и настроить соответствующий механизм проверки подлинности, чтобы обеспечить успешное сканирование источника данных.
Действия по регистрации
Перед настройкой проверки источника данных важно зарегистрировать источник данных в Microsoft Purview.
Откройте портал управления Microsoft Purview, выполнив следующие действия.
- Перейдите непосредственно к https://web.purview.azure.com учетной записи Microsoft Purview и выберите ее.
- Открытие портал Azure, поиск и выбор учетной записи Microsoft Purview. Нажмите кнопку портала управления Microsoft Purview .
Перейдите к схеме данных —> источники
Создайте иерархию коллекции с помощью меню Коллекции и назначьте разрешения отдельным вложенным коллекциям при необходимости.
Перейдите к соответствующей коллекции в меню Источники и щелкните значок Зарегистрировать , чтобы зарегистрировать новый источник данных ADLS 1-го поколения.
Выберите источник данных Azure Data Lake Storage 1-го поколения и нажмите кнопку Продолжить.
Укажите подходящее имя для источника данных, выберите соответствующую подписку Azure, имя существующей учетной записи Data Lake Store и коллекцию и нажмите кнопку Применить.
Учетная запись хранения ADLS 1-го поколения будет отображаться в выбранной коллекции.
Проверка
Предварительные требования для сканирования
Чтобы иметь доступ к сканированию источника данных, необходимо настроить метод проверки подлинности в учетной записи хранения ADLS 1-го поколения. Поддерживаются следующие варианты:
Примечание.
Если для учетной записи хранения включен брандмауэр, при настройке проверки необходимо использовать метод проверки подлинности управляемого удостоверения.
Управляемое удостоверение, назначаемое системой (рекомендуется) — как только создается учетная запись Microsoft Purview, в клиенте Azure AD автоматически создается системное управляемое удостоверение. В зависимости от типа ресурса для выполнения проверок требуются определенные назначения ролей RBAC для SAMI Microsoft Purview.
Управляемое удостоверение, назначаемое пользователем (предварительная версия). Как и управляемое системой удостоверение, управляемое удостоверение, назначаемое пользователем, — это ресурс учетных данных, который можно использовать для проверки подлинности Microsoft Purview в Azure Active Directory. Дополнительные сведения см. в руководстве по управляемому удостоверению, назначаемому пользователем.
Субъект-служба . В этом методе можно создать новый или использовать существующий субъект-службу в клиенте Azure Active Directory.
Проверка подлинности для сканирования
Использование управляемого удостоверения, назначаемого системой или пользователем, для сканирования
Важно предоставить учетной записи Microsoft Purview разрешение на сканирование источника данных ADLS 1-го поколения. Вы можете добавить системное управляемое удостоверение или управляемое удостоверение, назначаемое пользователем, на уровне подписки, группы ресурсов или ресурса, в зависимости от того, на какие разрешения на сканирование у него должны быть.
Примечание.
Чтобы добавить управляемое удостоверение в ресурс Azure, необходимо быть владельцем подписки.
На портал Azure найдите подписку, группу ресурсов или ресурс (например, учетную запись хранения Azure Data Lake Storage 1-го поколения), которые вы хотите разрешить сканировать каталогу.
Выберите Обзор, а затем — Обозреватель данных.
Выберите Access в верхней области навигации.
Выберите Выбрать и добавьте имя Microsoft Purview (которое является системным управляемым удостоверением) или назначаемое пользователем управляемое удостоверение (предварительная версия), которое уже зарегистрировано в Microsoft Purview, в меню Выбрать пользователя или группу .
Выберите Разрешения на чтение и выполнение . Обязательно выберите Эта папка и все дочерние элементы, а также Запись разрешения на доступ и запись разрешений по умолчанию в параметрах Добавить, как показано на снимке экрана ниже. Нажмите кнопку ОК.
Совет
Запись разрешения на доступ — это запись разрешения для текущих файлов и папок. Запись разрешений по умолчанию — это запись разрешений, которая будет наследоваться новыми файлами и папками. Чтобы предоставить разрешение только существующим файлам, выберите запись разрешения на доступ. Чтобы предоставить разрешение на сканирование файлов и папок, которые будут добавлены в будущем, включите запись разрешения по умолчанию.
Использование субъекта-службы для сканирования
Создание субъекта-службы
Если необходимо создать субъект-службу, необходимо зарегистрировать приложение в клиенте Azure AD и предоставить доступ к субъекту-службе в источниках данных. Эту операцию может выполнять глобальный администратор Azure AD или другие роли, например администратор приложений.
Получение идентификатора приложения субъекта-службы
Скопируйте идентификатор приложения (клиента) в обзоре уже созданного субъекта-службы .
Предоставление субъекту-службе доступа к учетной записи ADLS 1-го поколения
Важно предоставить субъекту-службе разрешение на сканирование источника данных ADLS 2-го поколения. Вы можете добавить доступ для субъекта-службы на уровне подписки, группы ресурсов или ресурса в зависимости от необходимых ему разрешений.
Примечание.
Чтобы добавить субъект-службу в ресурс Azure, необходимо быть владельцем подписки.
Предоставьте субъекту-службе доступ к учетной записи хранения, открыв учетную запись хранения и выбрав Обзор -->Data Explorer
Выберите Access в верхней области навигации.
Выберите Выбрать и добавьте субъект-службу в выборе пользователя или группы .
Выберите Разрешения на чтение и выполнение . Обязательно выберите Эта папка и все дочерние элементы, а также Запись разрешения на доступ и запись разрешений по умолчанию в параметрах Добавить. Нажмите кнопку ОК.
Создание сканирования
Откройте учетную запись Microsoft Purview и выберите Открыть портал управления Microsoft Purview.
Перейдите к схеме данных -->Sources , чтобы просмотреть иерархию коллекций.
Щелкните значок Создать сканирование под источником данных ADLS 1-го поколения, зарегистрированным ранее.
При использовании управляемого удостоверения, назначаемого системой или пользователем
Укажите имя для сканирования, выберите управляемое удостоверение, назначаемое системой или пользователем, в разделе Учетные данные, выберите соответствующую коллекцию для сканирования и выберите Проверить подключение. При успешном подключении нажмите кнопку Продолжить.
При использовании субъекта-службы
Введите имя для сканирования, выберите соответствующую коллекцию для сканирования и выберите + Создать в разделе Учетные данные.
Выберите соответствующее подключение к хранилищу ключей и имя секрета , которое использовалось при создании субъекта-службы. Идентификатор субъекта-службы — это идентификатор приложения (клиента), скопированный, как указано ранее.
Выберите Проверить подключение. При успешном подключении нажмите кнопку Продолжить.
Определение области и выполнение сканирования
Вы можете область сканирование в определенные папки и вложенные папки, выбрав соответствующие элементы в списке.
Затем выберите набор правил сканирования. Вы можете выбрать системный набор правил по умолчанию, существующие настраиваемые наборы правил или создать новый встроенный набор правил.
При создании нового набора правил проверки выберите типы файлов , которые будут включены в правило сканирования.
Вы можете выбрать правила классификации , которые будут включены в правило сканирования.
Выберите триггер сканирования. Вы можете настроить расписание или запустить проверку один раз.
Просмотрите проверку и выберите Сохранить и запустить.
Просмотр сканирования
Перейдите к источнику данных в коллекции и выберите Просмотреть сведения, чтобы проверка состояние сканирования.
Сведения о сканировании указывают ход проверки в состоянии последнего запуска и количество отсканированных и классифицированных ресурсов.
Состояние последнего запуска будет обновлено на Выполняется, а затем завершено после успешного выполнения всей проверки.
Управление сканированием
После завершения сканирования можно управлять или выполнять их снова.
Выберите имя сканирования для управления сканированием.
Вы можете запустить сканирование еще раз, изменить сканирование и удалить сканирование
Примечание.
- При удалении сканирования ресурсы каталога, созданные на основе предыдущих проверок, не удаляются.
- Ресурс больше не будет обновляться с изменениями схемы, если исходная таблица изменилась и вы повторно просканируете исходную таблицу после изменения описания на вкладке схемы Microsoft Purview.
Можно снова выполнить добавочную илиполную проверку .
Дальнейшие действия
Теперь, когда вы зарегистрировали источник, следуйте приведенным ниже руководствам, чтобы узнать больше о Microsoft Purview и ваших данных.